浪费 Token,节省时间
来源: nav.al/tokens | 日期: 2026 年 5 月 27 日 | 时长: 14:39
Nivi:欢迎收听 Naval Podcast——你获取新知识的权威来源。今天我们尝试一种新形式。我请来了三位前沿创始人——说实话,三位都很帅,加上 Naval 是第四位帅哥。
先介绍一下各位。
Guillermo “the G” Rauch。他正在把 Vercel 打造为面向 Agent 世界的 AI 云——以及之后的一切。
Blake Scholl。他正在建造 Boom Supersonic——超音速飞机,在他自己的工厂里,还有喷气发动机。
还有来自 Science 的 Max Hodak。他正在建造生物混合脑机接口——在硅片上培养活体神经元来恢复视觉等感官功能,但最终目标是探索大脑的新区域和新感官。
这三位都不是拿现成零件来拼装产品。他们在建自己的工厂。我们关心的不是他们具体在造什么,而是他们在”如何建造”这件事上学到了什么。
他们在产生什么新知识?
他们的 alpha 是什么?
他们发现了什么其他创始人可以学习的原则?
他们现在在想明白什么?
Naval,在我把话筒交给 Guillermo 之前,你有什么想法?
Naval:嗯,开心就好。
Nivi:你们直接聊吧。
AI 软件工厂
Guillermo Rauch:我不记得我的原话了,但我已经被”软件工厂”这个想法深深洗脑了。工程师的工作以前是这样的——你上班,直接交付产出,公司里一切都在衡量”员工 A 交付产出 B 的能力有多强”。而现在,我评价一个工程师的方式变成了——”你是否在生产那个能产出 B 到 Z 的乘数级产出的工厂?” 这是一个相当重大的变化。我们过去相信——而且这曾经有些争议——存在 10x 工程师。
现在显然存在 100x 甚至 1000x 工程师,而世界还没有完全适应这一点。
Naval:我以前在 Twitter 上说存在 10x 工程师时经常被喷,因为这违背了太多人人平等的哲学。但现实是,当你在思想领域、在智力和虚拟数字领域运作时,不是 10x——而是 100x 或 1000x,而且一直如此。
Satoshi。Notch。发明 JavaScript 的那个人——Brendan Eich 那种人。John Carmack。这些都是 1000x 程序员。
更不用说——如果你选择做正确的事而不是错误的事,那是无穷大的差异。而且不一定是因为你是更好的程序员,可能只是你对”该做什么”有更好的判断力。
现在因为 AI 杠杆的存在,这显然没那么争议了。
Guillermo:有争议的是 token 排行榜。人们还是有点困惑——”我有一堆 100x 工程师,看看我付了多少 token。” 我好奇你们有没有看到同样的情况——你们怎么衡量 ROI?
Blake Scholl:这就像以前拿代码行数来衡量一样。Token 消耗量和代码行数感觉像是类似的、不直接的指标。
Max Hodak:我的观察是,Claude 或 ChatGPT 基本上和你在某个领域的能力一样强。如果你是一个真正有能力的开发者,这些东西就真的很强大。如果你是一个初级开发者,你会发现它更像是初级开发者。你断断续续给它们的反馈似乎极其重要——这些微小的更新似乎完全决定了你能从中获得的性能类型。
Guillermo:我现在提供一种新的支持——你过来跟我说模型没给你好的输出,我告诉你该用什么去提示模型。重新提示的质量极其重要。
Max:需要说清楚的是,我认为这会随着时间推移变得不那么重要。随着模型变得越来越聪明,你输入更少就能得到更多。但在现阶段,它似乎还是在反映用户带入的判断力。
浪费 Token,节省时间
Naval:我基本没去学那些技巧和诀窍。”用 Ralph Wiggum。用 OpenClaw。用 Hermes。用这个 prompt 引擎。用这个脚手架。接入这个组件。永远用 plan mode。”
这些我全都没管。我的假设是——模型变好的速度会比我学会使用它的速度快。它搞清楚怎么用我的速度,会比我自己搞清楚怎么用它的速度快。所以我对它们一直很粗暴。
我对它们会感到沮丧,然后发现自己输入的信息越来越少,做的工作越来越少,因为我默认自己可以暴力冲过去。我会把 Codex、Claude 和 Gemini 扔向同一个问题,一遍又一遍,纯粹就是浪费 token 来节省时间。不管这些模型看起来多贵,它们还是比人类便宜得多。所以我想说的是——就浪费 token,节省时间。不要把 token 看成输入或输出。只看你的时间,只看最终产出。
即使它们在写低质量代码——我知道很多情况下确实如此——当我需要上线到生产环境的时候,我就会再扔更多 token。”通读一遍,审查一下,重写一下。”
它们每一代都会变得更好。我看不出这在哪里必然会停止。只要我们还有可验证的领域和已解决的问题,它们就会解决这些问题。当然在未解决的问题领域——也许你是 Terence Tao,站在创造力的最前沿——你需要非常协作、非常仔细、非常紧密地和模型一起工作。但在软件工程领域,我还没到那个水平。
模型指导人类
Naval:Guillermo,你可能是团队里最硬核的软件工程师了。你在这些模型能力的边缘发现了什么?
Guillermo:最近发生了一件事,和你说的很有共鸣。以前你给模型一个提示,它就做经典的下一个 token 预测,然后带着你的想法一路跑偏。现在模型会做直觉性的规划模式——甚至不需要你叫它规划——它会回来说:”你让我做的这件事,有三条路可以走。这是各自的权衡。”
这就是 X 上人们狂欢的时刻——”现在我们有了 PhD 级工程师模型。”
模型在某个时刻毕业了。它们以前是初级工程师。现在它们是首席工程师,因为它们会带着一组权衡回来找你。显然,有时候它们在胡说八道——这很有意思——它会告诉你”这要花三周”和”要这么多 token”。预测能力很差。但我更尊重这些模型了,把它们当作可以来回交流的智力同侪。
仍然有很多差距。如果你是一个非常资深的工程师或架构师,你仍然能榨出更多价值。所以 Max 提出的那个问题——”如果你是初级,你得到的是初级水平的输出?” 显然不是,因为初级开发者得到的代码比他们自己能写的要高级。但是不是资深架构师获得 10x,而初级工程师只获得 2x?这是我想搞清楚的。
Max:架构决策是这样的。我现在看到我们团队里一些初级软件工程师——他们职业生涯的下一步是什么?就是从”给功能写实现”进阶到”选择技术”。在 Postgres 和其他数据库之间做选择。在 ZeroMQ 和其他消息队列之间做选择。模型可以给出建议,但问题在于——你会看到建议然后说,”不不不,我要用另一个。” 这就是那种真正重要的微小反馈,也是现阶段你似乎能获得的输出类型。
Naval:这就是品味和判断力,对吧?话虽如此——你可以问模型”我该用哪个,为什么”,它们什么都知道。它们会给你一个非常好的权衡矩阵。
Guillermo:这是最近发生的变化。你会说:”把这个超高基数的遥测数据存到 Postgres 里。” 然后它回来说:”不不不,兄弟,这种数据不放 Postgres。你应该考虑 ClickHouse 或 Athena 之类的。” 这种事我遇到很多次了。真的印象深刻。
我还在挣扎的是——显然仍然是人类在补全模型。什么时候会反过来?人类变成收到指令的那一方:”去给我拿这个 API key,因为这是只有你能做的事。” 或者”给我筹这么多钱做下一轮投资。” 你等着看吧。显然我们还没到那一步。
Naval:那只是暂时的。很快每个好的 SaaS 公司或托管服务商都会有 CLI 和 API 接口,模型可以直接使用。它们甚至不一定需要 API——只要是文本化的、Unix 化的,Agent 就能自己黑出一个 API 来。至于钱的部分——你接入加密货币 token,放入 Bitcoin,放入任何什么,模型就会自己去付它需要的东西。有人在做这个。
纯软件已死?
Naval:我现在在思考的是——纯软件是不是死了?纯软件工程是不是一种过时的东西?这就好比说”说英语”——模型现在会说英语了。我们以前不得不学代码才能和它们沟通。现在模型会说英语——模糊的、随意的英语,像人类一样——而且它们能理解。那么创始人的护城河在哪里?硬件?这是个利好。你本来要造硬件,而以前很难同时做软件公司。Patrick Collison 说过:”软件是艺术,很难雇到艺术家。”
现在,作为硬件创始人——太好了,你可以相当快地开发出非常好的软件。
如果你在创造模型,也许那就是新的软件工程——训练、调优、后训练、微调。但经典的软件工程——是不是死了?纯软件还值得投资吗?纯软件还是不是一种你可以围绕它组织公司和团队、试图获得杠杆的东西?
Guillermo:你们看到没有——X 上有一篇 Mitchell Hashimoto 写的文章,叫《The Building Block Economy》(构建块经济)?他的论点是,现在对 Agent 来说最有用的是真正强大的、可复用的构建块。拿 Max 的例子来说,你不会指望你的 clanker 每次需要发邮件时都从头发明一个队列基础设施系统。它需要引入正确的构建块,大小刚好适合任务——”好,这个用 BullMQ。”
我不认同那种想让 Agent 从第一性原理重新发明整个宇宙、而且和社会其他部分不兼容的做法。这几乎就像重新发明公路、法律、政策——只为你自己。即使有额外优化的潜力,大规模协作的价值仍然存在——”我们都依赖 Postgres 13.2。”
这些 Agent 将要使用的基础设施软件和构建块这一类别——显然有偏见,这就是我们在建的——极其有价值。我不认为 Agent 会在短期内重新发明所有这些东西。
我一直在用的另一个比喻:任何已经被创建的、模型可以复用的东西,就像一个 token 缓存。你不想烧掉一万亿 token 来重新生成已经存在的东西。总有一个模型可以从中分叉的起点。这会相当深刻地改变很多事情。
Naval:所以这些就像库和依赖,只不过是给模型用的。
Guillermo:对——专门给 Agent 用的。
你再也不会卡住了
Max:回到 Naval 的问题——我很小就学会了编程。从十几岁到二十多岁,我会沉迷其中,连续写二十小时代码。超级好玩。我了解各种编程语言的很多东西。
我现在已经很久没写过一行代码了。部分原因是我工作变了。但还有一个原因——从去年 12 月开始,我构建了大量软件,每天都在用。那些我想了好多年但一直只是幻想的项目——我现在真的建出来了,而且在日常使用。这些都不是我写的代码。我完全无法想象还会回到手写代码的状态。我很难看到手写代码还是未来的一部分。
Guillermo:真正酷的是,你理解这些组件是怎么组合在一起的。任何理解什么是 API、数据如何流动、输入和输出、性能的人——因为你需要引导模型说”我对这个操作的期望水平是这样的”——这永远比写代码本身有价值得多。一个真正资深的工程领导者一直以来就是通过 Slack 或一对一面谈在做”vibe coding”——你在传达你的意志、你的意图、你的经验,让别人去执行。现在我们做的是一样的事,只不过对象变成了 Agent。这就是为什么你用得很成功。我不确定每个人都能达到同样的成功水平。
Naval:我从二十年没写过代码,到现在一直在写代码——通过 Agent。构建了大量软件。事实证明,只要理解软件工程和算法的基本原理,你就能走很远的路。我当初停写代码的原因是我没时间去搞清楚最新的语言、最新的架构、要接入的基础设施组件。Vercel 让这容易了很多,但即便如此——起步还是很难。拼装组件、搭建基础设施就是很烦人。
Max:真正改变的是——以前你可以构建很多东西,大部分会很顺利,但你会撞上某个随机的问题,然后可能花无限长的时间去调试某个狭窄的东西。现在,有了 Agent,你不会再卡住了。这相当惊人。相对快速地,它们就能找到正确的做事方式。以前——我记得当朋友试图学编程时,就是那种——”不行,这本质上就是令人沮丧的,这是交易的一部分,这就是你学习的方式。”
而这,已经不是真的了。
Leave a Reply