真实痛点
为什么 Agent 说完成了,但结果不能用?
Agent 很快回复完成,但文件打不开、内容没覆盖重点,或者根本没有可交付产物。
直接答案
Agent 是否完成,不能看它怎么说,要看验收标准。每个任务开始前都应该写清楚完成态:文件在哪里、能否打开、覆盖哪些要点、哪些动作必须人工确认。
适合谁
- 文档产出
- 网页检查
- 资料整理
- 排障
- 自动化任务
不适合谁
- 没有完成标准的探索聊天
- 只看最终一句话的任务
- 没有权限检查的自动执行
真实任务例子
让 Agent 生成报告时,验收不是它说已生成,而是报告链接能打开、章节完整、引用材料清楚、待确认项单独列出。
输入
- 任务目标
- 输出格式
- 产物位置
- 检查规则
- 失败时怎么回报
过程
- 先写完成标准
- 执行中保留中间结果
- 结束后自检
- 列出未完成项
- 让人确认关键风险
中间结果
- 验收清单
- 产物路径
- 自检结果
- 失败原因
- 下一步建议
最终验收
- 产物真实存在
- 能被打开或使用
- 覆盖关键需求
- 未完成项不伪装完成
常见误区
- 只看 AI 文本回复
- 不要求产物路径
- 没有失败分类
- 把容量限额当普通失败