Agent 设计模式地图
这是一份以“问题驱动”组织的 Agent Design Patterns 地图:
不是在比谁更“高级”,而是在解释——当系统引入新能力后,会出现哪些新失败模式,于是人们发明了哪些模式来对付它们。
演化主线(从简单到复杂)
- Single-shot(无 loop):快、便宜,但不稳。
- 结构化输出:当你需要 JSON/Schema 时,必须引入“解析 + 修复重试”。
- 工作流:当控制流可预先确定,用 Prompt Chaining / Routing。
- Agent loop:当下一步依赖环境观测,用 Tool Calling + ReAct(Reason-Act-Observe)。
- 可靠性:当错误代价高,用 Maker-Checker / Voting / CoVe + retry/熔断/降级。
- 记忆与检索:当知识不足,用 Retrieval Loop → Agentic RAG(证据账本)。
- 规划与搜索:当任务长且不确定,用 Plan & Solve / PER / REWOO / DAG / Tree Search。
- 多智能体:当需要专业化与规模,用 Manager-Worker / Agents-as-Tools / Group Chat / Handoff / Magentic。
- 治理与评测:当要上线,用 Policy + Guardrails + HITL + Tracing + Eval Harness。
知识导图(模式家族)
mindmap
root((Agent Patterns))
工作流
Prompt Chaining
Routing
Agent Loop
Tool Calling
ReAct
可靠性
Maker-Checker
Voting(自洽投票)
CoVe(验证链)
Retry/Backoff
Circuit Breaker
Cache
记忆与检索
Memory(KV/Session)
Retrieval Loop
Agentic RAG(证据账本)
Reflexion
STORM(研究写作)
规划与搜索
Plan & Solve
PER(重规划)
REWOO(批量工具)
LLM Compiler(DAG)
LATS(树/束搜索)
Self-Discovery(策略模块)
多智能体
Manager-Worker
Agents-as-Tools
Group Chat/Council
Handoff(分诊/升级)
Magentic(账本+停滞检测)
治理
Policy(工具策略)
Guardrails(Tripwire)
HITL(审批)
可观测与评测
Tracing
Eval Harness
“看到 X 就用 Y”(选择决策树)
flowchart TD
A["起点:定义任务"] --> B{"需要机器可读输出?"}
B -->|是| SO["结构化输出 + 修复重试"]
B -->|否| C{"多步推理?"}
C -->|否| SS["Single-shot"]
C -->|是| D{"控制流固定?"}
D -->|是| WF["工作流:Prompt Chaining / Routing"]
D -->|否| E{"需要外部工具/动作?"}
E -->|否| PL["规划:Plan & Solve / PER"]
E -->|是| RL["Agent loop:Tool Calling + ReAct"]
RL --> R{"错误代价高?"}
R -->|是| REL["可靠性:Maker-Checker / Voting / CoVe + Retry/熔断"]
RL --> K{"知识不够?"}
K -->|是| RAG["Retrieval Loop / Agentic RAG"]
PL --> S{"需要图/搜索?"}
S -->|是| SEARCH["LLM Compiler(DAG) / LATS(Tree Search)"]
RL --> MA{"需要专业化/并行?"}
MA -->|是| MULTI["多智能体:Manager-Worker / Agents-as-Tools / Group Chat"]
MULTI --> HO["Handoff:分诊/升级"]
MULTI --> MG["Magentic:账本 + 停滞检测"]
REL --> GOV{"要上线/高风险?"}
GOV -->|是| SAFE["Policy + Guardrails + HITL + Sandbox"]
SAFE --> EV["Tracing + Eval Harness"]
本书结构
- 基建(Building Blocks):模式复用的最小运行时能力(结构化输出、工具、loop、trace、memory…)
- 模式(Patterns):每个模式一页,强调 解决的问题 → 核心 loop → 取舍 → 演化路径
- 治理与评测:如何上线(安全/权限/审批),以及如何做回归(eval)