心智模型

Agent 设计模式之所以容易乱，不是因为模式太多，而是因为我们经常把几个层级混在一起讲。

这本小册子的主线是：能用更简单的结构解决，就不要急着上更复杂的 Agent。

一张图

flowchart TD
  A["一次模型调用"] --> B["固定流程（Workflow）"]
  B --> C["Agent 循环"]
  C --> D["多 Agent 协作"]
  D --> E["权限、护栏、评测"]

越往右，系统越灵活；也越贵、越慢、越难测试。复杂度不是免费的。

如果任务只需要一次模型调用，就停在这里：

这不是“不够 Agent”。这是工程上的好选择。

Workflow 的关键是：路径由代码决定。

比如：

抽取信息 -> 校验格式 -> 改写文本 -> 输出结果

步骤提前知道，分支也有限。这种情况下，固定流程通常比 Agent 循环更稳、更便宜，也更容易写测试。

常见模式：

Agent 循环的关键是：下一步由模型决定。

典型过程是：

当前状态 -> 模型决定动作 -> 执行动作 -> 拿到工具返回 -> 更新状态 -> 再来一轮

只有当下一步真的依赖工具返回时，才需要这一层。比如：

ReAct 就是最经典的 Agent 循环。

多 Agent 协作不是“自动更聪明”。它只是把不同职责拆开。

当一个 Agent 同时背着太多东西时，才考虑拆：

拆开以后，你会得到专业化；也会付出沟通成本、状态同步成本、调试成本。

只要 Agent 会做真实动作，就要开始问上线问题：

这部分不是“高级功能”，而是让系统可上线的安全带。

这也是 Anthropic 那篇文章的核心建议之一：从简单、可组合的结构开始，只在必要时增加复杂度。

这里不会先塞给你一个大框架。每个模式都会尽量做到：

你要学的不是术语本身，而是：某个失败模式出现时，为什么这个模式刚好能补上。

参考：