任务例子
OpenClaw 排障 Agent:把“坏了”拆成可验证链路
只看到任务失败,但不知道是页面、队列、模型、凭证还是环境问题。
直接答案
排障 Agent 要做的是分层定位:前端、任务队列、Worker、模型、凭证、环境、产物。每一步都要有证据和验证动作,不能只看最后一句失败提示。
适合谁
- 任务失败排查
- 凭证问题
- 模型限流
- 网页访问失败
- 产物缺失
不适合谁
- 直接重启生产服务
- 绕过安全门禁
- 未经确认修改配置
真实任务例子
任务失败后,Agent 根据 jobId、错误原文和最近改动,判断是模型限流还是 Worker 未执行,并给出验证步骤。
输入
- 错误截图
- jobId
- 错误原文
- 最近改动
- 运行环境
过程
- 定位层级
- 提取关键词
- 查最小证据
- 给修复建议
- 定义验收任务
中间结果
- 错误分类
- 影响范围
- 复现步骤
- 验证清单
最终验收
- 有原始错误
- 能定位层级
- 修复后有真实任务验收
- 容量阻断明确标记
常见误区
- 直接猜原因
- 只看页面提示
- 没有 jobId
- 把限额失败说成发布成功