术语谱系:从 Prompt 到 Agentic Engineering(2022-2026 五代术语进化线)
本文位置:这是 Agentic Coding 思想入门系列的”补遗 / 词典篇”。 前面五篇讲的是思想原典,这一篇讲的是它们用的语言。 你也许听过 prompt engineering,可能刚习惯 context engineering —— 但 2026 年新出现的 harness engineering 和 agentic engineering 是什么、跟前两个什么关系、为什么这一年突然冒出来,这就是这篇要说清楚的事。
🔥 为什么这个谱系重要
如果你不掌握这五个词的层级关系,你会在每一篇技术博客里迷路:
- 看到”prompt engineering 已死”,不知道作者只是在说底层而非整体
- 看到”context engineering 是新王”,不知道它其实是过渡形态
- 看到”harness engineering”和”agentic engineering”,以为是同一个东西的两种说法 —— 它们不是
更要命的是,很多 2025-2026 之交才出现的概念,中文圈直到现在还没有定译,大部分翻译都把它们译成同一个词。这是认知上的灾难。
完整谱系一图(按时间 + 抽象层级)
2022-2024 Prompt Engineering ← 调单条指令的字句
↓ (被包含)
2025 Context Engineering ← 调整个 context window 的信息编排
↓ (被包含)
2025末-2026 Harness Engineering ← 调整个 agent 工作环境的基础设施
↓ (是它的实践面向)
2026-04+ Agentic Engineering ← 协调多 agent 同时维持质量标准
严格包含关系:Prompt ⊂ Context ⊂ Harness,后者完全囊括前者作为子问题。 Agentic Engineering 是 Karpathy 给”在 Harness 里工作”这件事起的消费侧名字。
五个词,逐个拆解
1. Prompt Engineering(2022-2024)
定义:调一条 prompt 的字句、结构、示例、约束,让模型在单次对话里给出更好的输出。 焦点:单条指令。 典型问题:“这个 prompt 怎么写更好?” 遗产:few-shot、CoT(chain of thought)、role-play、system prompt 这些技术都属于这一层。 为什么够不着了:它假设问题是单轮的。一旦你要做多步骤工作流、跨工具协调、跨 session 接力,prompt engineering 这一层就完全不够。
一句话:Prompt engineering 是文字层的工艺。
2. Context Engineering(2025)
定义:决定 context window 里放什么、不放什么、什么时候放、用什么顺序放。 焦点:整个 context window 的信息架构。 典型问题:“这次调用我应该让 LLM 看到什么?” 关键技术:context isolation(不同子任务隔离)、context reduction(压缩、丢弃无关)、context retrieval(按需注入文档/搜索结果)、context rot 防御。 Anthropic 官方推过的术语:他们 2025 年的《Effective context engineering for AI agents》是这个词的奠基文。
一句话:Context engineering 是信息层的架构。
🟢 译者点评:从 prompt 到 context 是一个层级跃迁 —— 从”调一句话”升到”管一整个内存空间”。12-Factor Agents 的 “Own your context window” 这条原则,讲的就是这一层。
3. Vibe Coding(2025-02,Karpathy 创造)
定义:描述你想要什么,接受 AI 给你的结果。不写细节、不审 prompt、不做工程纪律。 焦点:消费侧,人怎么用 AI 写代码。 Karpathy 自己的说法:“raises the floor for everyone”(把所有人的下限抬高)。任何人现在都能 vibe code 出一个能跑的软件。 重要里程碑:这个词进了维基百科。
🟢 译者点评:Vibe coding 不是 engineering 谱系里的一环,它是用户行为的命名。它跟 prompt/context engineering 不在一个轴上 —— 前者是消费,后者是生产。但因为 Karpathy 影响力,这个词在 2025 大半年是行业默认词。
4. Harness Engineering(2025 末-2026,Anthropic 主推)
定义:整个 agent 工作环境的工程化 —— 包括工具、记忆、约束、反馈循环、生命周期、跨 session 接力机制。 焦点:架构层,而不是优化层。 Anthropic 自己的描述:“Claude Agent SDK is a powerful, general-purpose agent harness.”(Claude Agent SDK 就是一个通用 agent harness。) 奠基文:Anthropic 工程博客《Effective harnesses for long-running agents》(2025-11)和《Harness design for long-running application development》(2026-03)。
Harness 包含但不仅限于:
- 工具集设计(每个工具的命名、参数、错误信息)
- context 管理(compaction、isolation、retrieval)
- 跨 session 状态接力(feature lists、progress files、git checkpoints)
- 多 agent 编排(planning agent / coding agent / evaluation agent 三件套)
- 权限审批与人在回路(human in the loop)
- 评估与可观测性
最实战案例:Stripe 每周用这套打法 ship 出 1300 个 AI PR(据 The New Stack 报道)。
一句话:Harness engineering 是基础设施层的工程。
🟢 译者点评:Harness 是 2026 最重要的术语 —— 它把过去所有 agent 优化经验整合进了一个统一框架。Ralph Loop 是一种最简的 harness;Claude Code 是一种复杂的 harness;Superpowers 是搭在 Claude Code 这个 harness 之上的”工作流模板”。理解了 harness,你回头看前五篇文章会全部贯通:Karpathy 在讲 harness 应该长什么样,Anthropic 在讲 harness 怎么造,Dex Horthy 在讲 harness 必须遵守什么纪律,Geoffrey Huntley 在讲极简 harness 已经够,Armin Ronacher 在讲今天造 harness 还是一团乱。
5. Agentic Engineering(2026-04+,Karpathy 升级版)
定义:协调多个 stochastic, capable agents 同时不损失质量标准的工程实践。 焦点:消费侧的工程化(Karpathy 自己的说法)。 Karpathy 的关键时间点:
- 2025-12 —— 他自己写代码的比例从 80% 翻转到 80% 委托给 agent(他自己的拐点)
- 2026-04 —— 在 Sequoia AI Ascent 2026 上正式宣布 vibe coding 过时,提出 agentic engineering 作为接班词
Karpathy 自己的对比(原话):
- Vibe coding:raises the floor —— 让所有人都能搞软件
- Agentic engineering:preserves the quality bar —— 让专业软件不因为 vibe coding 牺牲质量
- “You are not allowed to introduce vulnerabilities because of vibe coding.”
一句话:Agentic engineering 是用 harness 工作的纪律。
🟢 译者点评:Agentic engineering 跟 harness engineering 是同一件事的两面:
- Anthropic 是基础设施提供方,所以叫”harness engineering”(造 harness 的工程)
- Karpathy 是基础设施使用方,所以叫”agentic engineering”(在 harness 里工作的工程) 两边其实在描述同一个 2026 年的现象。用 prompt/context/harness 时讲生产侧,用 agentic engineering 时讲消费侧。
五张地图的认知功能
| 词 | 抽象层 | 解决的问题 | 谁在主推 |
|---|---|---|---|
| Prompt Engineering | 字句层 | 单条指令的输出质量 | OpenAI 早期 / 学术圈 |
| Context Engineering | 信息层 | context window 的内容编排 | Anthropic / 12-Factor 派 |
| Vibe Coding | (消费侧用户行为) | 让非工程师也能造软件 | Karpathy(2025-02) |
| Harness Engineering | 基础设施层 | agent 工作环境的整套工程 | Anthropic(2025末-2026) |
| Agentic Engineering | (消费侧工程纪律) | 用 harness 工作的同时不丢质量 | Karpathy(2026-04+) |
实践含义:这五个词怎么影响你的工作
如果你是个体开发者
- 正在做的事就是 agentic engineering,即使你没听过这个词
- 你今天的核心问题不是”怎么写好一个 prompt”,而是”怎么搭出能让我跑全天的 harness”
- 别再花时间死磕 prompt 的字句优化 —— ROI 已经低于投入到 harness 工程的回报
如果你在造 agent 产品
- 你在造 harness,不在造 prompt 工具 —— 用这个口径重新审视你的产品定位
- harness 的真正护城河是:工具集设计 + context 管理 + 跨 session 接力 + 评估机制
- 12-Factor Agents 的 12 条原则全是 harness 工程指南
如果你是技术领导
- 招聘描述里写 “prompt engineer” 已经过时,找 “agentic engineer” 或 “harness engineer”
- 你团队的瓶颈大概率不在”找到会 prompt 的人”,而在”建出团队层面的 harness 标准”
推荐阅读顺序
如果你刚入门:
- 先读这一篇(术语谱系)
- 再读 Karpathy Software 3.0(#01) —— 他给坐标系
- 再读 Anthropic《Building Effective Agents》(#02) —— context engineering 实战
- 加读 Anthropic《Effective harnesses for long-running agents》—— harness engineering 奠基文
- 再读 12-Factor、Ralph、Armin
🔗 调研来源(可校验)
- Anthropic 官方:Effective harnesses for long-running agents
- Anthropic 官方续作:Harness design for long-running application development
- Anthropic 官方:Effective context engineering for AI agents
- Karpathy 自己的 Sequoia Ascent 2026 总结:karpathy.bearblog.dev/sequoia-ascent-2026
- 行业报道:The New Stack - Vibe coding is passé
- 行业报道:Analytics Drift - Karpathy Declares Vibe Coding Obsolete
- 实战案例:The New Stack - Stripe + harness engineering | MindStudio - Stripe 1300 PRs/week
- 第三方综述:Epsilla - Why Harness Engineering Replaced Prompting in 2026
- 第三方对比:Atlan - Prompt vs Context vs Harness Engineering
- 综述:Data Science Dojo - Harness Engineering
- 工具清单:awesome-harness-engineering (GitHub)
- Anthropic 三 agent harness 报道:InfoQ - Anthropic Designs Three-Agent Harness
- Karpathy 演讲视频:YouTube - From Vibe Coding to Agentic Engineering
- ZenML 案例库:Anthropic Long-Running Agent Harness