术语表(关键概念)
这份术语表用于统一本书中反复出现的关键名词与翻译方式。
如果你在某个页面看到同一个词被用成了别的意思,以这页为准。
解决的问题
Agent 系统“变复杂”的第一步,往往不是代码,而是术语开始漂:
- “agent” 和 “workflow” 被混用
- “tool calling” 和 “function calling” 被当成两件事
- “retrieval loop” 和 “agentic RAG” 说不清差别
双语站点里这种漂移更常见。这页的目标很朴素:一个概念,一个名字,一套解释,避免全书变成名词动物园。
什么时候用
- 你在读某个 pattern 页面,想快速对齐定义。
- 你在写/改页面,需要统一 EN↔ZH 翻译与术语。
- 你怀疑两个名词其实是一个东西(通常是)。
它是如何运作的(怎么用)
- 每个概念只保留 一个主名词。
- 常见同义词可以写在备注里,但不要拆成两条互相竞争的词条。
- 词条尽量短:1–2 句定义 + 1 条“容易混淆点”。
- 如果某个词条需要长段解释,说明它应该升级成单独页面。
一个能对照的例子(新增一个词条)
新增词条时至少补齐:
示例:
| **Tool policy(工具策略)** | 约束哪些工具能被调用(以及参数边界)。 | 通常 allowlist-first;配合 guardrails。 |
常见失败模式与对策
- 同义词泛滥:强制一个主名词,同义词只做备注。
- 中英漂移:把 EN/CH 当作一对文件,一次改动两边一起更新。
- 越写越像百科:如果需要多段解释,拆成单独页面更清晰。
核心运行时概念
| 术语 |
简述 |
备注 |
| Workflow(工作流) |
控制流由代码/配置固定(或有限分支)。 |
通常比 agent loop 更好测、更稳定。 |
| Agent(代理) |
下一步由 LLM 基于当前 state 动态决定的控制器。 |
这里的“Agent”指控制流,不指“意识”。 |
| Agent loop(闭环) |
决策 → 执行(工具)→ 观测 → 更新 state → 重复。 |
ReAct 是最典型形态。 |
| State(状态) |
控制器“看得见”的一切:messages + ledger/scratchpad + 相关记忆。 |
能结构化就结构化。 |
| Action schema(动作协议) |
用可解析的结构表达“下一步做什么”(tool/final/ask)。 |
避免靠文本正则解析。 |
| Tool calling(工具调用) |
选择工具/函数 + 传参 → 得到 observation。 |
也常被叫做 function calling。 |
| Observation(观测) |
工具输出回写到 state。 |
检索到的文本默认不可信。 |
| Budget(预算) |
硬限制:max steps / tool calls / tokens / 时间 / 成本。 |
防止 loop 失控。 |
检索与记忆
| 术语 |
简述 |
备注 |
| Retrieval(检索 / RAG) |
从外部知识库拿文档,把回答“落在证据上”。 |
传统 RAG 往往是“检索一次就回答”。 |
| Retrieval loop(检索循环) |
检索 → 阅读 → 改写 query → 再检索 → 直到够用再停。 |
面向搜索的专用 loop。 |
| Agentic RAG |
把检索放进 agent loop:模型决定何时/检什么/何时停。 |
常配合“证据账本”做审计。 |
| Evidence ledger(证据账本) |
结构化记录:claim → evidence(doc_id/snippet/source)。 |
用来避免“引用摆设”并支持审计。 |
| Memory(记忆) |
跨 step 或跨 session 的持久化信息(KV、摘要、经验)。 |
长任务与 Reflexion 常用。 |
| Episodic memory(情景记忆) |
把一次运行的经验/教训以文本或结构化形式存起来。 |
类 Reflexion 的“无训练学习”。 |
可靠性与验证
| 术语 |
简述 |
备注 |
| Maker-Checker(写-审) |
先生成,再按准则批评/打分,再改写(可多轮)。 |
也叫 reviewer/critic。 |
| Voting / 自洽投票 |
采样多个候选答案,再投票/排序/融合。 |
更稳但更贵。 |
| CoVe(验证链) |
先产出 claim,再验证 claim(工具/规则),失败就修。 |
把验证当作一等公民。 |
| Retry / Backoff(重试退避) |
失败后用延迟或调整参数重试。 |
需要配合预算 + 熔断。 |
| Circuit breaker(熔断) |
连续失败就停止或降级(工具故障/限流)。 |
防止“重试风暴”。 |
规划与搜索
| 术语 |
简述 |
备注 |
| Plan & Solve |
先显式产出计划,再执行/回答。 |
改善多步推理。 |
| PER(Plan-Execute-Replan) |
计划 → 执行 → 基于反馈/失败/预算触发重规划。 |
把 replan 显式化。 |
| ReWOO |
“不看观测先推理”:先写工具计划,再批量执行工具。 |
可能比 ReAct 更省 token。 |
| LLM Compiler |
把计划编译成 DAG(依赖图),再按依赖执行。 |
有利并行与复用。 |
| LATS(树搜索) |
在多条轨迹上做搜索:展开/评估/回传,选更好的路径。 |
成本高,用于硬问题。 |
多智能体
| 术语 |
简述 |
备注 |
| Manager-Worker |
管理者分解任务并委派给专长 worker。 |
适合专业化 + 并行。 |
| Agents-as-Tools |
把每个专长 agent 当成可调用的 tool,让 orchestrator 统一调度。 |
简化路由与治理。 |
| Group chat / Council(圆桌) |
多个 agent 讨论/互评,最后由 selector 选择或融合。 |
可类比 debate/committee。 |
| Handoff / Triage(分诊/交接) |
根据线索把任务交给最合适的 agent(或人)。 |
避免“一个 agent 包打天下”。 |
治理、可观测、评测
| 术语 |
简述 |
备注 |
| Policy(策略) |
约束工具 allowlist、参数边界与权限(按任务/路由)。 |
建议“默认拒绝”。 |
| Guardrails(护栏) |
对输入/输出/工具调用的 tripwire:拦截、脱敏、要求审批。 |
处理注入、越权、泄露等。 |
| HITL(人工审批) |
对高风险动作进行人工确认(写入/花钱/prod)。 |
必须支持审批后继续执行。 |
| Tracing(追踪) |
结构化日志:步骤、工具调用、决策、耗时。 |
用于 debug 与评测。 |
| Eval harness(评测框架) |
可复现的任务集 + 打分 + 回归报告。 |
能“证明你变好了”。 |
“人味”(文档写作)
| 术语 |
简述 |
备注 |
| 模板味 |
看起来像模板拼出来的低信息密度文字。 |
解决:加真实失败模式 + 能对照的例子。 |
| 禁用短语列表 |
明确禁止的“AI 腔”填充词。 |
最好在生成阶段就约束。 |
参考资料
- Agentic RAG(概览):https://www.ibm.com/think/topics/agentic-rag
- Agentic RAG(术语解释风格):https://exploreagentic.ai/glossary/agentic-rag/
- Agentic RAG(公共部门风险视角):https://www.gov.uk/government/publications/ai-insights/ai-insights-agentic-rag-html
- Reflexion(论文):https://arxiv.org/abs/2303.11366
- Plan-and-Solve(论文):https://arxiv.org/abs/2305.04091
- ReWOO(论文):https://arxiv.org/abs/2305.18323
- LATS(论文):https://arxiv.org/abs/2310.04406
- “人味”写作习惯(实用):https://www.microsoft.com/en-us/microsoft-copilot/copilot-101/humanize-ai-text