AI 时代中,我们应该把时间和精力花在哪里?
AI 时代,并非之前有些人说的只是昙花一现或者泡沫,而是某种缓慢但是坚定的变革。
虽然在本世纪初也出现过互联网泡沫。那个时候,人们对互联网太过乐观。但是跨过二十余年的长度,回头去看,其实那个时候对互联网的想象最狂野的人,也想象不到现在的互联网是什么样子。
所以说,当我们要去预测未来的形状时,一定要谨慎。
因为我们正处于大变革的时代之中,而我们对未来的想象,哪怕再狂野,都有可能不及真正未来的 1%。但与之相对的,也有可能我们对未来的想象太过乐观,从而导致我们押注了一个不正确的方向。
那么,我们应该怎么做呢?
需要更加缜密深刻的思考。需要勇于推翻自己的一切预设。
我这篇文章,就想讲一讲 AI 带来的底层革新。它实际上不是一个简单的工具升级,而是一种思维方式的转变。
不是泡沫
我在不止一个地方读到过这种类比,AI 时代有点像印刷术的诞生。在印刷术诞生之前,手抄是非常重要的一件事。但是印刷术诞生之后,不只是知识变得更加普及了,更重要的是由此带来的整个社会结构的革新。
我现在的工作流程,就是一个非常典型的例子。我在做自己实际的科学研究之外,还会去学最新的这些工程实践。它们背后其实蕴藏的哲学思想是不变的,是人类这几千年来沉淀下来的思想。只是说,之前的工具条件没有达到,或者说即使达到了,人们也没意识到,原来应该用这种思想来做事。
我认为目前学术生产的模式完全是工业时代的,很快也会迎来彻底的革新。目前,AI 用来做 auto research,它的能力已经非常强了,很快这些学术期刊会被海量的投稿给淹没。
有些人可能会觉得,学术生产会退回几十年前的老路上,由把持学术期刊的主编、副主编来决定哪些东西能不能发表。但我觉得不是这样的。
根据第一性原理,学术生产会回到其本质,就是去思考这个学科本身为什么而存在。
它难道是为了发表文章,或者为了满足期刊主编的品味吗?不是这样的,而是为了去解决更核心、更本质的东西。
比如说物理学,是为了描述自然现象。工程,是为了建造。数学呢,是为了发现各种抽象结构之间的关联。
这些都不是为了发表文章,也不是为了满足期刊主编。所以说,学术期刊可能在未来甚至都会消亡,或者诞生一种新的模式。
这种模式下,我们更着眼于说,这个学科从混沌中逐渐分离出来的时候,它最初的目的是什么。
学术的研究途径会进行较大的革新,计算机也是这样,社会也是如此。
我们都要学着去回到本源上去思考:不变的东西到底是什么?
我一开始也相信,应该先学会每一行代码
这些思考,都从我读到坏了,我成AI的乙方了!Anthropic论文爆火,谁还敢无脑Copy?开始。
Anthropic 的研究发现,学习写代码最正确的方式,是让 AI 构建原型,然后询问每行代码是什么意思,最后坚持自己手写代码。或者说,将 AI 生成的代码粘贴到编辑器中时,主动去询问 AI:为什么要这么写?背后的逻辑是什么?有没有更好的写法?
这种说法当然是有道理的。这样的话,不仅能真正学会东西,并且之后在集成测试或者 debug 的时候,表现也会更加出色。最糟糕的就是「甩手掌柜型」的做法,这种方式在真正需要代码训练或做测试的时候,是完全不清楚该怎么做的。
但我后来慢慢开始怀疑,这种思路会不会恰恰是 AI 时代真正到来之前的旧时代思路,是一种不相信 AI、只相信人的能力的惯性。
这个思路的目的,是让工程师学会一个新的语言,学会一种新的编程方式。但这个真的有必要吗?工程师学会了的东西,难道不正是大模型已经会的东西吗?
人现在成了这个系统中最拖慢的东西。如果 AI 可以自动集成测试,自动对非常大的系统进行 debug,那么我们是否还需要这种缓慢的学习方式呢?其实这类问题,就建立在「AI 模型能做的事情很有限,我们人必须要进行修修补补」的思维之上。
后来我发现,人可能才是最慢的那个环节
当我们站在变革的开端 | Jiayuan (JY) Zhang 这篇文章,则提出了几乎完全相反的观点。
这篇文章的作者加元认为,之所以程序员使用 AI 并没有在很大程度上提升效率,是因为他们依然在用旧的方式使用 AI,并没有采用真正适合 AI 自主工作的方式。
这是我最近在实际工作中发现的一点:当我们过度干预 AI 的自主性,也就是替它进行决策时,反而会得到一个非常差的结果。相反,如果让 AI 自行决策、自行改进,效果反而会更好。也就是说,我们根本不关心代码到底是如何实现的,只关心任务如何完成,或者说,我们只告诉 AI 要完成什么任务,由它自己去决策该做什么。
我最近在动手实现的项目,也呈现了相同的规律。刚开始我们让 AI 进行验证,但后来发现,与其给 AI 提供工具,不如让 AI 自己写工具,效率反而更高。
这让我第一次很明确地意识到,也许真正的问题不是「AI 会不会写」,而是「人为什么还要把自己卡在写的那一层」。
真正要重做的,不是代码,而是环境
加元那篇文章里还有一个我很认同的类比。正如电力取代蒸汽机时经历了那 40 年的磨合期,电力的出现反而并没有立刻提高工厂的工作效率。本质上,是因为电力作为一种新的动力来源,起初却被迫适应旧的生产环境。
专门为蒸汽机所设计的工厂,根本不适用于电力机械,需要对整个工厂的环境做彻底的更新。在这方面,福特汽车就做得非常好,它是真正意义上的现代流水线的诞生。
现在的情况也是如此。AI 作为一种全新的生产力,需要一套与之相匹配的、更适合的生产环境。谁能真正把 AI 的潜力挖掘出来,谁就将站在这次科技革命胜利者的位置。
所以说,实际上当「甩手掌柜」并不是最糟糕的,反而应该当甩手掌柜。我们要脱离代码的细节,去思考更宏观、更深刻的东西,以此充分发挥 AI 的能动性。
于是我想清楚这一点之后,给我论文的合作者发了如下的消息:
我发现我们做这个问题的思路是对的,就是直接交给 AI 来写代码,自己完全不写。
但是我们之后做下一篇文章的时候,代码的写法可能又要改。所以不仅是交给 AI 写代码,而且我们要建立一种环境,让 AI 能够自主完善代码、自动跑测试。我们可以不把时间和精力花在理解 AI 的代码之上,而是直接用更高级的方式使用 AI。
目前我们耗费了大量精力的,其实是让我们自己去跑一些实验。实际上这些东西,我觉得完全应该交给 AI 来做。我们最终交付给它的,应该只是一个需求,以及衡量该需求被满足的指标,然后由 AI 想尽各种办法去完成。
就像我们这次之所以做得这么快,有一个很关键的一点:我们没有告诉 AI 必须遵照某种数值求解 BSPDE 的方式,而是 AI 自己发现了这个最小二乘蒙特卡罗。我做下一个项目的时候,可以接着思考这个问题。而且我觉得理论证明可能也能用类似的方式去完成,当然它的难度可能更大一点。
我决定彻底改变我们做研究的方式,之后有时间我会再出一篇相关的文章来解释。
代码接近无成本之后,整个世界都会被重排
再说回加元的文章的另外一个洞见。它通过思考商业模式的核心,也就是分散与重组,论证了目前我所观测到的一种现象:人人都能写应用,人人都能满足别人的需求,这实际上是一种「分散」。
在这种分散背后,终将会面临下一次重组,进而重塑整个社会的业态。
第一个分散的过程,实际上必须建立在「代码无成本」这件事之上。现在的 AI,实际上可以以无成本生成的代码去满足人的想法,那么人就更应该着眼于更广泛的东西。这个所谓的更广泛的东西,也将是未来的真正赢家。
我们需要接受这一点:我们不再需要亲手写代码,也不再需要亲手做各种繁琐的事情了。那么整个社会会变成什么样子?我们所做的事情,最核心的问题会变成什么样?
就以抄写员为例。在印刷术出现之前,他们根本没有办法想象自己原本的工作会变得毫无意义。但仔细思考抄写员的本质,实际上是传播知识。那么在那个时代,他们就应该迅速转化为出版商,接受「知识已被广泛传播、原有工作已无用武之地」的现实。
同样的,对于工厂主和蒸汽机来说也是如此。当时的核心,在于商品的生产会迎来进一步的大爆发。或者说,在移动互联时代,真正赚钱的是那些基础设施的厂商和平台。
这篇文章所预言的三种产品业态,也正是我所感知到的,或者说我发现已经实现了的三种业态。但是我觉得这依然不够,依然需要解放思想。就拿我们做科研的过程来说,真正刺痛我的不是「AI 已经能不能做某件事」,而是很多事情一旦自己做通一次,AI 很快就可以永远接过去做。
文章最后提到了一种哲学观点,即如果我们只在乎怎么做的话,会被 AI 取代。这和我的观点是一样的。既然有些事情只要自己能做一次,那么 AI 就可以永远地代替掉,AI 就可以永远地做这件事情。既然做什么也不再重要了,那么更重要的就是我们有什么别人没有的东西,我们获得了什么别人没有的东西。
我一度以为,未来最稀缺的是资源、信息和权力
这篇文章认为,我们需要抓住一些核心的、不变的资源。那什么是这些资源呢?就以我正在从事的科研工作为例。
比如说做科研,那么你能做什么才能做过 AI 呢。
但是如果你是期刊的编委,如果你有 connection,如果你是决定某个研究到底好还是坏的人,那么这样的人在未来反而会更加安全、优秀。所以说科研的业态就变成了:从之前想的是自己做什么更好的东西出来,而变成了说,我做什么东西才能够打动或者满足当前这个拥有发表资源的人的心。
我觉得最重要的是判定我们的研究是否有意义的人。也就是说,我们应该尽可能去打动那些期刊的编委,以及整个科学界比较有话语权的人。
因为未来海量的论文会涌进来,只有这些人才是真正稀缺的,也就是那些能决定什么东西是好的人。
我的这样的思考真的是对的吗?
这个思考蕴含着某个我非常不喜欢的东西,即我们不能琢磨事,而是要去琢磨人。我觉得这个非常别扭。
但很快我又意识到,这个答案还是不够深
后来我又读到了Claude Code 之父:AI 的改变不止于代码,程序员需要改变整个工作流,以及它对应的原视频 Building Claude Code with Boris Cherny。这篇访谈讲的是,在一个工程师不再亲自写代码的时代,要怎么完成一个复杂系统的构建。
这是 Anthropic 的工程师在讲新时代的编程是什么样子。他提到一个有意思的想法,就是他非常理解一个人学了这么多年,怎么就突然会发现,自己原来会的东西,别人借助 AI 也能做出更多,这种痛苦。
他说,编程的第一性原理不是美感,不是艺术品,而归根结底是某种建造手段,是要做东西出来的。在这篇文章中,他也提到了印刷机的比喻,这和我前面引用的那篇推文,其实是类似的。
他提出,在新时代,一个人真正的能力是会横向连接、会协作、会跨系统地进行工作。这样的人会越来越稀缺,而且越来越值钱。在新时代,最重要的是保持一种谦逊,因为很有可能之前不行的路,之后就可以了。之前认为不对的东西,之后就对了。大模型的进步日新月异,人要保持谦逊。
4 月 9 号早晨(也就是今天),OpenAI 发布了他们的 Agent Manager。这个东西,实际上就是可以去管理各大公司、各个超级个体生成的 Agent。
这实际上是我在前几天听播客的时候,一个人想做的。他当时做那个产品的时候,实际上就非常焦虑,就担心 Claude 把它给做了。
但实际上我觉得,这就是新时代的业态,就是大公司发现了需求,然后迅速就将它完成掉。实际上每个超级个体都可以干这件事情,但是只要是这种面向大众的需求,那么确实完成得会非常快。
与之相对,我又看到了 Anthropic 的技术博客 Scaling Managed Agents: Decoupling the brain from the hands。它来自于宝玉的翻译,也给了我很大的触动。它大概的意思就是说,随着模型能力的更迭,在本地写 Harness Engineering 其实已经意义不大了,因为自己针对模型性质而做的一系列优化,在新的模型上线之后可能就已经不再需要了。它这个平台实际上完全是一个沙箱,是对所有想做 Agent 生态的人的降维打击。
这篇技术博客首先从这个点出发,然后讲了计算机软件工程的一个底层逻辑,就是抽象 read 函数。在上个世纪 70 年代读纸带,和现在读网络云存储,实际上它根本不 care 底层是什么东西,它只需要读就对了。那么现在这个 Agent Manager,就想做类似的事情。
那么这个新的平台,它做的事情只是将大脑和手分开,也就是将 Harness 工程、会话 session,还有工具 tools 给分开。
我仔细看了一下他们的工程实现。其实并没有什么太多的新东西,只是人类过往在几十年之中发展出来的一些想法的又一次实践。他们抓住了一个核心的观察:不要再去假设 AI 模型的能力有限,从而给它精心配置一大堆工具来去辅助它。
现在不是这样的,AI 的能力进化得太快,那些工具反而会成为束缚。
如何去做呢?要回归到第一性原理,回到做这件事情的目的是什么。我们的目的就是为了让 AI 尽可能地快速且纯粹地帮我们进行创造。在这个过程之外,其他的事都是我们人为加上去的。
我也就将之前的想法进行了推翻。学术期刊编委这种模式,都可能会被替换掉。因为学术期刊设立的目的是为了从海量的论文中精选出比较重要的内容,但在未来,论文的数量会更加海量,仅靠人工去做选择其实已经不够了。
于是我又回到了文章开头的那段对学术科研、学术研究未来的想法。我们应该回到最核心的目的之上,去思考每个学科,它背后的目的是什么。为什么会开设这样的学科?我们能否直接去完成这样的目的本身?
这个思考的转变,是在我读完去他的Harness | AI最严厉的父亲之后进一步成形的。
他这里提出了第三个观点。也就是看似从两年前爆火的 Prompt engineering、Context engineering,到 Harness engineering,再到现在的 Environment engineering,一代一代地革新,但本质上都是一样的,只是将工程师凭借直觉和经验踩的坑,
一步一步地细化下来,固定下来。也就是说,人类在逐渐学着和 AI 相处。
那么在这个过程中,就很有必要去学习高质量的人的思想和精神,包括现在目前最成功的产品 Codex、Claude Code,他们是如何去驾驭 AI 的,能够提炼出什么样的黄金规则。
就像控制理论。它对于狂暴的蒸汽机,只做了一件事,就是加了一个反馈。那我们应该也要做这样的事。
这是人类在几千年的智慧探索中沉淀下来的、不变的东西。正如现在数学的很多想法,都可以向上追溯到古希腊雅典时代,可以追溯到牛顿,可以追溯到希尔伯特。他们的想法源于深厚的哲学根基。现在的工程师做的事情也是一样,他们在源源不断地从人类过往的智慧中,汲取那些不变的东西。
所以最后,还是要回到人
这也是为什么,我在之前的几篇文章中反复提到,在 AI 时代,我们更重要的能力是:
- 与人进行连接,去满足人的需求
- 尽可能地维系共同体,去找到志同道合的人
- 发展自己跨学科进行能力迁移的技能
于是我来到了本文的最后一个引用来源,即吴恩达给斯坦福大学学生提供的职业建议,也就是这段演讲:Stanford CS230 | Autumn 2025 | Lecture 9: Career Advice in AI。
整个视频长达一个半小时,但吴恩达本人那 20 分钟的演讲是非常精华的。如果你对现状感到迷茫、不知所措,一定要去听听这位世界上最擅长创新、最有创造活力的大师,关于世界的未来他是如何想象的,以及他给年轻人的建议又是什么。
正如我们做数学研究时,如果我们不知道该做什么,那我们就去问陶哲轩。作为一个不停地「革自己命」、不停去学习最新知识的人,他的博客是非常宝贵的知识来源,也是个人,至少是数学职业生涯的指引方向。因为从他的博客里,我了解到了学数学一定要关注什么,以及不该关注什么。
吴恩达提到,AI 完成复杂功能的能力,每 7 个月翻一番。在 AI coding 的领域,必须要用最先进的工具,因为每一代工具的能力,其翻倍速度是非常快的。
对于 AI 来说,最有用的就是去造东西。只有真正地去造东西,把它造出来,你才能学会。现在造东西比以前要容易得多。现在把一个东西造出来的难度已经不高了,但更难的是你要去详细地思考:你要造什么,以及你造出来的东西到底是什么。
吴恩达同样强调,更重要的是同情心、同理心,能够对用户进行更深刻理解的能力,才是更重要的。关于个人的部分,他说,在 AI 时代,能够决定你学习速度和深度的是你身边的人。你身边的人越优秀,你的速度就越快。你需要构建,或者说去寻找一个能力极强的社群。这种人脉关系和人脉网络,是非常重要的。
我希望大家认为,对一个人来说,聪明、勤奋,以及用人脉来做好事,是最重要的。他进一步强调了 hard working 的重要性,因为只有 hard working,才能够有大量的时间来去做真正有意义的事情。比如说,你把周末的时间用来看一些 videos,还是说你用 agent 来做想做的小玩意儿?后者是更加重要的,而且能让你学到更多的东西。
于是在 AI 时代,我们更需要去学习和了解「人」本身。
这个过程当然需要阅读经典。但在阅读经典的同时,不能仅局限于对文本一个字一个字地细抠,否则这只是将自己的想法重新映射到文本之中。我们在阅读经典的同时,也要用现在最前沿、高效的工具去真正地创造价值。
所谓的创造价值,并不是说要挣多少钱,而是为周围的人服务,是找到一群志同道合的人,一起让这个世界变得更美好。在这个过程中,去实践自己从书本、从先贤那里学到的东西。
这在我看来,是这个时代应该要做的事。
交流
孙少文:讲得真好,分享我的两点思考:
1.我觉得期刊发表这种形式不会消失,它是学术共同体的一种具象体现,但是,它高高在上、生死判决的权力,会伴随其他更为民主的学术共同体的兴起和流行,而成为发表可选项之一;
2.我非常认可你说的把任务制作过程给AI,人只要它给出自己期待的结果就好,这样可以从繁琐的、可重复的、相对低级的工作中解放出来,去做更有意义、创造性的事。但是,也是我困惑的一点,人的创造性、更高层次的认知建立在哪?难道不需要一些繁琐、低级、重复的工作为基础吗?科幻作家Ted Jiang(特德•姜)曾讨论过AI是否能替代作家,他认为很难,因为作家写作就是要在一个个词语的筛选和组合中,慢慢知道自己想要表达什么。现在虽然已经出现了各种先进的媒介、表达方式,但是在对人性的洞察中,依旧不及19世纪那些伟大作家用纸和笔写出来的东西,不及几千年前,在日复一日的奔波劳作中口述下来的智慧(苏格拉底、孔子)。
感谢你的回复,我很受启发。也赞同你的观点。
确实如你所言一般,期刊会成为某个可选项,也将面临市场化的竞争。就像印刷术的诞生,让普通人拥有了解读圣经的权利。庞加莱猜想的证明,就没有发表在任何期刊上,而是挂在ArXiv上。
创造确实要从字斟句酌开始,研究数学也不可能跳过从纸笔推导修正直觉的过程。我提到AI辅助的创新,是一种平凡而非超越式的创新,是不需要天赋只需要努力就能做的那些创新。我想关于人性,哲学的洞察也是如此。