学习

概念
memory 模块提供了一套先进的、以任务为中心的长期记忆系统。
其核心目标是让代理能够从经验中学习、避免重复错误并持续提升任务完成能力。
核心功能
-
通过自我纠正实现自动学习 (train_on_task):
- 这是该模块最强大的功能之一。用户可以提供一个任务和期望的正确答案。
- 模块会驱动代理反复尝试完成任务,并使用一个基于LLM的Grader工具来自动判断结果是否正确。
- 如果任务失败,模块会启动一个学习流程(prompter.learn_from_failure),将任务描述、错误答案、正确答案和代理的工作历史全部提供给LLM,引导其分析失败原因、定位核心误解,并最终生成一个可以避免未来犯同样错误的insight。
- 这个新生成的insight会被临时用于后续尝试,如果它帮助代理成功完成了任务,就会被永久存入记忆库。
-
关于 train_on_task:这个功能是成本最高的"重武器"。它不应用于常规的、一次性的用户交互,而应作为一种离线的、用于构建核心技能的训练手段。例如,在产品上线新功能前,我们可以用它来为代理"批量注入"关于新功能操作流程的记忆。
流程
这个流程展示了当外部调用者需要学习并存储一个新计划时,模块内部的步骤。
