Harness 工程:AI Agent 时代的基础设施思维

2026年4月9日 · 647 字 · 4 分钟 · Ai Ai-Agent

题记: “Agents aren’t hard; the Harness is hard.”
— Ryan Lopopolo,OpenAI Codex 团队

引言:当模型不是瓶颈

过去两年 ,AI 工程师们花了大量时间优化 prompt、设计 context window、调试 RAG 方案。但越来越多团队发现:换了更强模型之后,问题并没有消失。

真正的问题不在模型本身,而在包裹模型的那层基础设施——社区给它起了一个名字:Harness(挽具/马具)

2026 年 2 月,这个概念集中爆发:Mitchell Hashimoto(Terraform 创始人)发表博客,OpenAI 发布 Codex 5 个月的实验报告,Martin Fowler 网站出现专题文章。所有人指向同一个结论——AI Agent 的军备竞赛,本质上是 Harness 的工程竞争。


一、什么是 Harness?

直观理解

想象你要教会一个人完成软件工程任务:

  • Prompt 工程 → 教他"说什么话"
  • Context 工程 → 教他"看什么资料"
  • Harness 工程 → 教他"在什么样的系统里工作"

如果用驾驶来比喻:

层级 驾驶类比
Prompt 告诉司机"向前开"
Context 给他地图、路标、仪表盘
Harness 修好路、设好护栏、装好后视镜,连刹车油门的响应曲线都调好

模型再强,给它一条泥泞小路也跑不快。

正式定义

Harness = 围绕 AI Agent 的一整套脚手架、约束机制和反馈循环。它包括: