Agent 设计模式地图

这是一份以“问题驱动”组织的 Agent Design Patterns 地图：
不是在比谁更“高级”，而是在解释——当系统引入新能力后，会出现哪些新失败模式，于是人们发明了哪些模式来对付它们。

演化主线（从简单到复杂）

Single-shot（无 loop）：快、便宜，但不稳。
结构化输出：当你需要 JSON/Schema 时，必须引入“解析 + 修复重试”。
工作流：当控制流可预先确定，用 Prompt Chaining / Routing。
Agent loop：当下一步依赖环境观测，用 Tool Calling + ReAct（Reason-Act-Observe）。
可靠性：当错误代价高，用 Maker-Checker / Voting / CoVe + retry/熔断/降级。
记忆与检索：当知识不足，用 Retrieval Loop → Agentic RAG（证据账本）。
规划与搜索：当任务长且不确定，用 Plan & Solve / PER / REWOO / DAG / Tree Search。
多智能体：当需要专业化与规模，用 Manager-Worker / Agents-as-Tools / Group Chat / Handoff / Magentic。
治理与评测：当要上线，用 Policy + Guardrails + HITL + Tracing + Eval Harness。

知识导图（模式家族）

mindmap
  root((Agent Patterns))
    工作流
      Prompt Chaining
      Routing
    Agent Loop
      Tool Calling
      ReAct
    可靠性
      Maker-Checker
      Voting(自洽投票)
      CoVe(验证链)
      Retry/Backoff
      Circuit Breaker
      Cache
    记忆与检索
      Memory(KV/Session)
      Retrieval Loop
      Agentic RAG(证据账本)
      Reflexion
      STORM(研究写作)
    规划与搜索
      Plan & Solve
      PER(重规划)
      REWOO(批量工具)
      LLM Compiler(DAG)
      LATS(树/束搜索)
      Self-Discovery(策略模块)
    多智能体
      Manager-Worker
      Agents-as-Tools
      Group Chat/Council
      Handoff(分诊/升级)
      Magentic(账本+停滞检测)
    治理
      Policy(工具策略)
      Guardrails(Tripwire)
      HITL(审批)
    可观测与评测
      Tracing
      Eval Harness

“看到 X 就用 Y”（选择决策树）

flowchart TD
  A["起点：定义任务"] --> B{"需要机器可读输出？"}
  B -->|是| SO["结构化输出 + 修复重试"]
  B -->|否| C{"多步推理？"}
  C -->|否| SS["Single-shot"]
  C -->|是| D{"控制流固定？"}
  D -->|是| WF["工作流：Prompt Chaining / Routing"]
  D -->|否| E{"需要外部工具/动作？"}
  E -->|否| PL["规划：Plan & Solve / PER"]
  E -->|是| RL["Agent loop：Tool Calling + ReAct"]
  RL --> R{"错误代价高？"}
  R -->|是| REL["可靠性：Maker-Checker / Voting / CoVe + Retry/熔断"]
  RL --> K{"知识不够？"}
  K -->|是| RAG["Retrieval Loop / Agentic RAG"]
  PL --> S{"需要图/搜索？"}
  S -->|是| SEARCH["LLM Compiler(DAG) / LATS(Tree Search)"]
  RL --> MA{"需要专业化/并行？"}
  MA -->|是| MULTI["多智能体：Manager-Worker / Agents-as-Tools / Group Chat"]
  MULTI --> HO["Handoff：分诊/升级"]
  MULTI --> MG["Magentic：账本 + 停滞检测"]
  REL --> GOV{"要上线/高风险？"}
  GOV -->|是| SAFE["Policy + Guardrails + HITL + Sandbox"]
  SAFE --> EV["Tracing + Eval Harness"]

本书结构

基建（Building Blocks）：模式复用的最小运行时能力（结构化输出、工具、loop、trace、memory…）
模式（Patterns）：每个模式一页，强调 解决的问题 → 核心 loop → 取舍 → 演化路径
治理与评测：如何上线（安全/权限/审批），以及如何做回归（eval）