小白概念
任务验收 是什么?
听过 任务验收,但不知道它在实际任务里承担什么角色。
直接答案
判断 Agent 是否真的完成任务的标准。
适合谁
- 理解 Agent 基础
- 拆真实任务
- 写任务提示
- 判断风险边界
不适合谁
- 背概念
- 堆术语
- 脱离真实任务的空泛学习
真实任务例子
URL 返回 200、文档可打开、摘要覆盖关键问题、截图存在。
输入
- 一个真实任务
- 相关材料
- 期望结果
- 限制条件
过程
- 先用人话解释
- 放进真实例子
- 指出常见误区
- 转成可执行提问
中间结果
- 概念解释
- 场景例子
- 误区提醒
- 任务提示
最终验收
- 能说清它解决什么问题
- 知道什么时候用
- 知道下一步怎么问 Agent
常见误区
- 只看 Agent 说完成了。
- 只记英文名,不知道怎么实践