Loop Engineering 是 2026 年 6 月被命名的新兴从业者术语。它把工程师从逐轮驱动 agent,推到设计调度系统、反馈系统和状态记忆这一层。
它更像 Harness Engineering 与 feedback-loop 思想的上层封装,而非独立新学科。
三个公开节点如何把 loops 命名成方法论。
三层循环、harness、feedforward 与 feedback。
厂商自报、RCT、DORA 与失败模式并读。
BA + SA + Agents 的交付体系、治理与路线图。
Anthropic / Claude Code
WorkOS 与 Acquired Unplugged 访谈中提出:工作变成 write loops。
OpenAI / OpenClaw
公开提醒:不要再提示 coding agents,而要设计提示 agents 的 loops。
Google
发布《Loop Engineering》,完成命名、定义和体系化。
指 agent 自身的 plan / act / observe / reflect 控制循环,技术祖先可追溯到 ReAct 范式。
指人退到调度系统设计层:自动触发、状态记忆、子 agent 编排与独立验证。
工程师逐步告诉 agent 做什么,人控制每一步。
关键变成:模型看到什么、上下文如何组织。
用 guides 和 sensors 把 agent 放进工程环境。
在 harness 上加入调度、状态、终止条件和 checker。
Loop Engineering 不是替代前几层,而是把它们包装成可自动触发、可验证、可持续记忆的运行系统。
Agent 执行、观察测试或报错、修正实现。
把 session 经验写回 skill、AGENTS.md、知识库。
事件触发、状态记忆、maker/checker 分离、自动运转。
不是一个 while 循环,而是触发、隔离、知识、连接、分工和状态记忆共同构成的工程系统。
定时、事件、hook、任务队列。
多 agent 并行时隔离文件冲突。
把项目经验沉淀为可复用说明。
连接 issue、数据库、监控、文档。
maker / checker 分离,避免自评。
状态存在 context 之外,长期推进。
Harness 先定义 agent 能做什么、如何观察后果;Loop Engineering 再把它变成可触发、可记忆、可持续运行的系统。
AGENTS.md、类型、lint、架构规则。
生成候选实现与执行动作。
测试、CI、日志、traces、浏览器。
负责触发、停止条件、记忆和升级人工。
cron、hooks、/loop、Codex Automations 等触发器。
隔离并行 agent,降低文件冲突。
把项目知识沉淀到可复用说明。
MCP 连接 issue、数据库、Slack、监控。
maker / checker 分工,避免自评。
状态存在 context 之外,长期推进。
读任务、改代码、运行局部验证、提交候选结果。它不拥有最终完成判定权。
独立读取 diff、测试、lint、类型、E2E、traces,决定是否继续循环或升级人工。
把行为写成机器可验证约束。
用确定性规则压缩 agent 误差。
让 agent 看到真实后果。
合并前让系统自动拦截。
最强,但目前对 Loop Engineering 术语本身几乎没有。
DORA、Faros、SWE-bench 等更适合作决策锚点。
OpenAI、Anthropic 数据亮眼,但要打折看待。
用于观察话语扩散,不适合单独支撑投资判断。
5 个月、约 100 万行代码、约 1,500 个 PR、零人工手写代码,是最常被引用的 harness engineering 实践。
自报、单项目、受控条件;且前 1.5 个月一度比人工慢约 10 倍。
2026 年 6 月材料称:2026 年 5 月超过 80% 合并代码由 Claude 编写,2026 Q2 工程师人均日产出约 8 倍于 2024。
最值得借鉴的不是数字本身,而是“每个 PR 的 Claude reviewer + 回溯事故捕获”的验证设计。
16 名资深开源开发者使用早期 2025 AI 工具完成任务,实际慢 19%;他们主观以为快了约 20%。
这不否定 agentic delivery,但说明工具收益依赖任务形态、代码库状态、反馈循环强度和验证成本。
AI 提升个人生产力与交付吞吐。
AI 与交付不稳定性存在正相关信号。
强测试、快速反馈循环、松耦合架构是释放价值的条件。
它不是 Loop Engineering,但证明“测试驱动、多阶段、迭代流程”能显著改善代码生成效果。
无人值守循环会持续烧钱,必须有预算、终止条件和告警。
代码跑得越快,人对系统意图的理解可能越落后。
语法正确但违反架构不变量、重复逻辑、污染边界。
Amdahl 定律转移到人工审查、规格确认和合规证明。
工程师上移为意图定义者、验证者和环境设计者。
把业务目标翻译成验收标准、样例和边界。
把架构约束、工具、数据和权限编码进 harness。
确认 agent 产出符合 spec、质量门禁和组织风险。
用户价值、流程、验收条件、异常场景。
集成模式、架构边界、数据模型、非功能要求。
生成实现、测试、迁移脚本、文档草案。
diff 审查、证据核对、反例搜索。
测试、lint、类型、CI、observability。
skills、知识库、决策记录、模板资产。
业务规格、架构约束、agent 执行、验证证据和组织记忆形成闭环,而不是一次性提示词。
价值、验收、反例。
架构、接口、门禁。
实现、测试、文档。
人工确认业务边界。
人工确认技术边界。
测试、CI、diff 审查。
把每轮经验写回组织资产,支撑下一轮 loop。
BA 写清业务价值、验收、反例和数据样例。
SA 把约束转成目录、接口、测试和门禁。
maker agent 在隔离 worktree 生成候选实现。
checker agent 与 CI 产出可审计证据。
执行、编辑、测试、生成 PR。
开发者工作台与任务编排。
测试、审查、变更解释。
模型 + harness 的组合评估。
issue、数据库、监控、文档系统。
让运行时反馈进入 loop。
agent 只拿任务所需权限。
每次合并可回放测试与日志。
高风险变更必须人工确认。
经验沉淀到 skill / docs。
自动化测试
快速反馈
松耦合架构
AISE 的核心资产不是某个提示词,而是一套能触发、执行、验证、记忆并持续改进的工程环境。
真正可操作的是反馈循环、门禁和状态记忆。
厂商数据可以参考,RCT 与 DORA 提醒我们重视稳定性。
BA 定义价值,SA 编码约束,Agents 在可验证环境中循环。