Appearance
可靠性设计
可靠性是 Agent 从 demo 走向生产的分水岭。
这节课解决什么问题
- 失败之后如何自动恢复
- 高风险动作怎么加保护
- 什么情况该降级,什么情况该停下来等人工处理
核心内容
- 超时、重试、熔断
- 幂等设计
- 降级策略
- Human-in-the-loop
本节产物
- 一套超时、重试和降级规则
- 一份高风险动作确认清单
- 一版错误恢复流程图
课堂实作
- 给 Agent 加上超时、重试和幂等保护
- 定义哪些动作失败后可重试,哪些必须停下
- 设计一个人工接管节点,避免高风险动作自动执行
并入项目
这一课会直接进入项目一的执行安全、项目二的回答兜底、项目三的任务恢复。
面试会怎么问
- Agent 失败后怎么恢复
- 为什么幂等对 Agent 很重要
- 哪些动作必须人工确认
