0
异步视界/agentic-coding-classics/karpathy-software-3.0
· AGENTIC-CODING-CLASSICS · 2026.05.06 · 10 MIN ·

Karpathy《Software 3.0:AI 时代的软件》

前特斯拉自动驾驶总监 Karpathy 把过去 50 年软件分成三代:1.0 写代码 → 2.0 训神经网络 → 3.0 写 prompt。这是定位任何 AI 工具的坐标系。精读 + 译者点评。 · by fancyoung
AI · HERO seed:4520260506 前特斯拉自动驾驶总监 Karpathy 把过去 50 年软件分成三代:1.0 写代码 → 2.0 训神经网络 → 3.0 写 prompt。这是定位任何 AI 工具的坐标系。精读 + 译者点评。
FIG.00 — cover · ai-generated · placeholder

Software 1.0 / 2.0 / 3.0 拼接共存图

原始来源:YC AI Startup School Keynote, 2025-06-17 | Latent Space 完整笔记 | Karpathy Twitter 自荐

🔥 影响力卡片

  • YouTube 主视频”Andrej Karpathy: Software Is Changing (Again)“播放量百万级
  • 现场观众 2,500 名 AI 学生与创始人(YC AI Startup School,SF,2025-06-17)
  • 被分析师称为”理解 AI 在软件中位置的定义性时刻”
  • Karpathy 本人罕见地连发推自荐(他平时极少自传播)
  • “Software 3.0” 这个词在他演讲后4 个月内成为行业默认词汇,后来 Sequoia AI Ascent 2026 上他自己又升级为 “agentic engineering”(因为 2025 末 LLM 已经强到 vibe coding 都过时了)

🎯 为什么必读

如果你只看一篇 AI 时代的”思想原典”,就看这一篇。

Karpathy 是前特斯拉自动驾驶总监、OpenAI 创始成员,他是这个时代最有权威给”软件”重新分代的人之一。他在演讲中提出的三分法 —— Software 1.0(写代码)、Software 2.0(训神经网络权重)、Software 3.0(写 prompt) —— 已经成为整个行业讨论的默认坐标系

读这篇你会拿到三个东西:

  1. 一个全新坐标系,以后看任何 AI 工具都能定位
  2. “自主滑块”(Autonomy Slider) 这一极其实用的产品设计原则
  3. “为 agent 设计产品”的视角 —— 而不是只为人

一句话总结

“The hottest new programming language is English.”(最火的新编程语言是英语。) —— 但 Karpathy 紧接着告诉你:写英文 prompt 只是开始,真正的工作是设计能让人和 AI 共同构成认知系统的产品。

💎 金句墙(英中对照,适合做卡片)

“Prompts are now programs.” “Prompt 现在就是程序。”

“The hottest new programming language is English.” “最火的新编程语言是英语。”

“Demo is works.any(), product is works.all().” “Demo 是 任何一次能跑就行,产品是 每一次都得能跑。” —— 这一句精准刺中了 2025 年所有”AI 演示效果惊人但产品落地一塌糊涂”的真相。

“LLMs are a bit like a coworker with anterograde amnesia.” “LLM 有点像一个患顺行性失忆症的同事 —— 它记不住任何新事情,只有上下文窗口这一段短期记忆。”

“Stochastic simulations of people, with emergent psychology.” “(LLM 是)人的随机模拟,有涌现的心理学。” —— 把 LLM 拟人化拟到这个程度还不令人尴尬,只有 Karpathy 能做到。

“Jagged Intelligence.”参差智能” —— 它在某些任务上是博士,某些任务上是幼儿园,毫无规律

“Iron Man Suit.” “钢铁侠战衣” —— 好的 AI 产品同时是”工具”和”自主体”,用户可以调节自主程度

📋 核心精读

Part 1 —— 三代软件

  • Software 1.0:人手写的代码。GitHub 是 Software 1.0 的图书馆。
  • Software 2.0:神经网络的权重。Karpathy 在特斯拉时把感知系统从手写代码全部换成了 2.0,“代码越写越少,网络越训越大”。
  • Software 3.0:prompt 就是程序。LLM 是解释器,context window 是内存,自然语言是源代码。

🟢 译者点评:这个分代法的真正野心,不是术语创新,而是告诉你 Software 3.0 正在蚕食 1.0 和 2.0。也就是说,大量”以前写代码做的事 / 以前训模型做的事”,都会被改写成”写一段 prompt 让 LLM 做”。这意味着程序员的核心技能正在迁移

Part 2 —— LLM 是什么

Karpathy 给 LLM 的多重隐喻:

  • 像 1960 年代的主机:贵、稀缺、需要分时共享(timeshare)
  • 像新的 OS:有内存(context)、有 CPU(模型)、有调度
  • 像同事:你跟它工作,需要交付清晰的任务说明
  • 像人的随机模拟:有”心理”、有”情绪”、会”自信”、会”撒谎”

为什么这些隐喻重要?因为它们决定了你怎么设计交互。把 LLM 当作”魔法回答机器”就只能做 ChatGPT 那种聊天框;把它当作”会失忆的同事”,你就会自然而然引入memory、worktree、handoff、checkpoint 这些概念。

Part 3 —— 部分自主性(这是这篇演讲最有产品启发的部分)

Karpathy 反复用 Cursor 举例:

  • Tab 补全 = 最低自主性,人主导
  • Cmd+K = 中等自主性,人提目标
  • Cmd+I(Composer)= 高自主性,AI 主导多步骤

好的 AI 产品都有一个”自主滑块”(Autonomy Slider),让用户根据任务、信任度、风险随时调节。

🟢 译者点评:这是这场演讲对产品经理最直接的礼物。所有让用户”全自动 or 全手动”二选一的 AI 产品,都设计错了。Perplexity 的 search → research → deep research 是另一个滑块例子。

Part 4 —— 演示与产品的鸿沟

Karpathy 引用他在特斯拉的经验:Waymo 在 2014 年就给他演示过零接管的自动驾驶,11 年过去了,FSD 仍然不够好。原因?

“Demo is works.any(), product is works.all().”

演示只需要”任何一次能跑”,产品需要”每一次都能跑”。从 90% 到 99.9% 的最后一段路,通常比前 90% 长几个数量级

🟢 译者点评:对所有”我们 AI demo 看起来已经做完了”的公司:你才走完前 10% 的工作量。这一段是给所有 AI 创业者的冷水。

Part 5 —— 为 agent 构建产品

Karpathy 提出一个极其重要但容易被忽略的观察:

未来的信息消费者有三类:

  1. (用 GUI 看)
  2. 传统程序(用 API 调)
  3. agent(新的!需要一种新的接入方式)

他点名表扬 Vercel 的文档写得对 agent 友好,批评 Clerk 的文档让 agent 难以解析。他推崇 llms.txt 这种让 agent 高效消费的标准化格式。

🟢 译者点评:这一段是给 SaaS / 开发者工具做产品的人最重要的提醒。未来 30% 以上的访问可能来自 agent,你的产品如果只为人设计,就是给自己关门。llms.txt 在他演讲后明显加速了普及。

结语

“This is the decade of agents.” “未来十年是 agent 的十年。”

不是 AGI,不是 superintelligence,就是 agent

🟢 译者总评

这篇演讲为什么会成为现象级,不是因为它给了答案,而是因为它重新定义了问题

它把”AI 时代的软件开发”从”写更多 prompt”这种战术问题,**升级为”我们在做什么样的 cognitive system”**这种战略问题。

如果你只从这场演讲带走三件东西:

  1. Software 3.0 已经在蚕食一切 —— 你写的不再是代码,是 prompt 是 spec 是 context
  2. 设计自主滑块,不要二选一 —— 用户的信任度需要被产品尊重
  3. 为 agent 设计你的产品 —— 它即将是你最重要的用户

最后一点 Karpathy 没强调但值得加上:他自己几个月后又升级了说法 —— “vibe coding 已经过时,现在叫 agentic engineering”。也就是说,这篇演讲本身是一个时代的标志,但那个时代正在以季度为单位被取代

🔗 延伸阅读

🔗 调研来源(可校验)