Agent Loop
Agent Loop 指 AI 智能体执行任务的标准循环:接收输入 -> 选择动作 -> 执行 -> 观察 -> 更新上下文 -> 重复。
典型流程
- 接收用户输入
- 基于当前上下文选择动作(从预定义的动作空间)
- 在环境中执行动作(如虚拟机沙箱)
- 产生观察结果
- 将动作和观察结果追加到上下文
- 形成下一次迭代的输入
- 循环直到任务完成
挑战
- 上下文随每个步骤增长(Manus 平均需要 50 次工具调用)
- 输出(函数调用)相对较短
- 导致输入/输出词元比例严重失衡(Manus 约 100:1)
优化考虑
- KV-Cache 命中率对成本和延迟至关重要
- 长循环易导致目标漂移(“drift off-topic”)
- 需通过Recitation for Attention Manipulation 保持目标可见
- Multi-agent System 有时能分解长循环为短循环