← 返回论文库

ReAct: Synergizing Reasoning and Acting in Language Models

Yao, Zhao, et al. (Princeton + Google) · 2022
L3.2 · LLM Agent Patterns & FrameworksICLR 2023#planning#tool-use
CORE IDEA
每步 LLM 输出 Thought + Action(调工具)+ Observation 循环,思考和行动交错。
CONCRETE EXAMPLE
HotpotQA/FEVER/ALFWorld 上比 CoT-only 提升 15-30%。
L-ANCHOR · 为什么在这一层重要
planning + action 的最基础模式,几乎所有现代 agent 用
arXiv:2210.03629源码 ↗

相关论文