ReAct: Synergizing Reasoning and Acting in Language Models

Yao, Zhao, et al. (Princeton + Google) · 2022

L3.2 · LLM Agent Patterns & FrameworksICLR 2023#planning#tool-use

CORE IDEA

每步 LLM 输出 Thought + Action（调工具）+ Observation 循环，思考和行动交错。

CONCRETE EXAMPLE

HotpotQA/FEVER/ALFWorld 上比 CoT-only 提升 15-30%。

L-ANCHOR · 为什么在这一层重要

planning + action 的最基础模式，几乎所有现代 agent 用

相关论文