← 返回论文库

Reflexion: Language Agents with Verbal Reinforcement Learning

Shinn, Cassano, et al. (Northeastern) · 2023
L3.1 · LLM Agent Patterns & FrameworksNeurIPS 2023#reasoning#self-improvement
CORE IDEA
失败 trace 让 LLM 写 reflection,下一次 attempt 把 reflection 作为 prompt,等于用语言做 RL。
CONCRETE EXAMPLE
HumanEval/AlfWorld 上比 ReAct 提升 10%+。
L-ANCHOR · 为什么在这一层重要
verbal RL
arXiv:2303.11366源码 ↗

相关论文