技术洞察

纠正是消费,约束是投资——如何停止和模型反复博弈

2026年5月4日 · 97 字 · 1 分钟 · 约束设计提示工程行为设计

模糊指令注定反复纠正。把边界写进规则而不是纠正里——从提示工程到行为设计的范式转变。

瓶颈已经移动：当推理、数据库、版本控制开始说同一件事

2026年5月4日 · 587 字 · 3 分钟 · 状态管理 Ai-Agent 基础设施 Kv-Cache 数据库

内存带宽、数据库运行时、“git”——三件看起来毫不相关的事,正在被同一个力量重塑：状态管理正在成为 AI 时代的基础设施瓶颈。

生成式搜索与推荐：LLM时代的信息获取新范式

2026年5月2日 · 426 字 · 2 分钟 · Llm 推荐系统信息检索生成式ai 搜索

从判别打分到序列生成：精读6篇2024-2025年核心论文,系统梳理生成式搜索与推荐的技术演进、核心方法（GenSAR/IntSR/SynerGen）、统一框架,以及工业落地实践

MCP 没死,但它不再是万能药

2026年4月30日 · 430 字 · 3 分钟 · Mcp Ai-Agent 技术分析

深度调研「MCP is Dead」现象的来龙去脉：它批评了什么、反驳了什么、最终说明了什么

Harness 工程：AI Agent 时代的基础设施思维

2026年4月9日 · 647 字 · 4 分钟 · Ai Ai-Agent

题记： “Agents aren’t hard; the Harness is hard.”
— Ryan Lopopolo,OpenAI Codex 团队

引言：当模型不是瓶颈

过去两年 ,AI 工程师们花了大量时间优化 prompt、设计 context window、调试 RAG 方案。但越来越多团队发现：换了更强模型之后,问题并没有消失。

真正的问题不在模型本身,而在包裹模型的那层基础设施——社区给它起了一个名字：Harness（挽具/马具）。

2026 年 2 月,这个概念集中爆发：Mitchell Hashimoto（Terraform 创始人）发表博客,OpenAI 发布 Codex 5 个月的实验报告,Martin Fowler 网站出现专题文章。所有人指向同一个结论——AI Agent 的军备竞赛,本质上是 Harness 的工程竞争。

一、什么是 Harness？

直观理解

想象你要教会一个人完成软件工程任务：

Prompt 工程 → 教他"说什么话"
Context 工程 → 教他"看什么资料"
Harness 工程 → 教他"在什么样的系统里工作"

如果用驾驶来比喻：

层级	驾驶类比
Prompt	告诉司机"向前开"
Context	给他地图、路标、仪表盘
Harness	修好路、设好护栏、装好后视镜,连刹车油门的响应曲线都调好

模型再强,给它一条泥泞小路也跑不快。

正式定义

Harness = 围绕 AI Agent 的一整套脚手架、约束机制和反馈循环。它包括：