Appearance
Agent Harness 框架
从零写 Agent 循环是最好的学习方式,但跑在生产环境里需要框架。框架处理了状态持久化、并发、错误恢复、可观测性这些琐碎但关键的问题。
这个模块给你选型标准,并教你用主流框架实现真实 Agent。
子课展开学习:
框架概览
| 框架 | 定位 | 适合场景 |
|---|---|---|
| 手写 Agent Loop | 不绑框架,自己控制循环 | 学习原理、原型、简单 Agent |
| LangGraph | 有状态图,工作流可视化 | 复杂多步流程、需要人工介入点 |
| MCP | 工具标准协议 | 工具复用、跨 Agent 共享能力 |
| 多 Agent 模式 | 协作架构 + 框架示例 | 角色协作、任务委派、Agent 间通信 |
课次
课次 01 · 手写 Agent Loop
框架的起点:不用框架,自己把 Agent 的循环写出来。底层接 HTTP、SDK 还是统一封装,都只是接入层选择。
你会学到:
- 多轮对话历史怎么组织
- Tool Use 的请求、执行和回填
- Streaming:流式输出怎么接回循环
- 手动实现 ReAct 循环:while 循环 + 工具分发
为什么要先学这个: 框架封装的是循环、状态和调度。不懂 Loop,用任何 SDK 或框架都会停留在会调用、不会定位问题的阶段。
课次 02 · LangGraph
LangGraph 用有向图(DAG)来表达 Agent 工作流:节点是操作,边是状态转移。适合复杂、需要审计的 Agent。
你会学到:
- State Graph:定义 Agent 的状态结构
- 节点(Node):每个 LLM 调用或工具执行是一个节点
- 条件边(Conditional Edge):根据状态决定下一步
- Checkpoint:状态持久化,支持暂停和恢复
- 中断(Interrupt):在关键节点暂停等待人工审批
什么时候用 LangGraph: 任务有明确的阶段、需要回滚、需要人工介入点、需要可视化流程图。
课次 03 · MCP(Model Context Protocol)
MCP 是 Anthropic 提出的工具标准协议:把工具定义、暴露、调用标准化,让工具可以跨 Agent、跨平台复用。
你会学到:
- MCP 服务器:把工具封装成独立进程,通过标准协议暴露
- MCP 客户端:Agent 如何发现和调用 MCP 工具
- 本地 MCP Server:在本地跑文件系统、浏览器、数据库工具
- 工具复用:同一个 MCP Server 被多个 Agent 共用
关键价值: 工具和 Agent 解耦。工具改了,不需要改 Agent 代码。
课次 04 · 多 Agent 模式
单 Agent 解决不了某些问题:任务太复杂、需要不同专业角色、需要并行处理。这一课先讲多 Agent 作为架构模式,再介绍常见框架和协议。
你会学到:
- Orchestrator-Worker 模式:主 Agent 规划,子 Agent 执行
- 角色定义:Research Agent、Coding Agent、Review Agent 分工
- 消息传递:Agent 之间怎么通信
- 终止条件:多 Agent 系统怎么知道任务完成了
- A2A(Agent-to-Agent)入门:为什么需要 Agent 间标准化协作协议
框架与协议举例:
- AutoGen:更偏底层,适合研究和复杂定制
- CrewAI:更偏 DSL,适合快速搭原型
- A2A:更像 Agent 间协作协议,重点是标准化发现、委派、状态回传,而不是直接替你做全部编排
课次 05 · 框架选型指南
决策矩阵:
| 需求 | 推荐框架 |
|---|---|
| 学习 / 原型 | 手写 Agent Loop |
| 复杂工作流 + 人工介入 | LangGraph |
| 工具复用 + 生态集成 | MCP |
| 多 Agent 协作原型 | AutoGen / CrewAI |
| Agent 间标准化通信 | A2A(了解概念与方向) |
生产环境需要考虑的问题:
- 可观测性:LLM 调用的 trace / span 记录
- 成本控制:token 用量监控,避免失控
- 错误恢复:哪些错误可以重试,哪些应该报警
- 延迟:框架的调度开销有多大?
