← 返回论文库
GFlowNet: Generative Flow Networks
Bengio, et al. (Mila) · 2021
L5.2 · Algorithmic FoundationsNeurIPS 2021 / JMLR 2023#search#generative
CORE IDEA
学到和 reward 成比例的 distribution 而非 argmax policy,explore 多 mode。
L-ANCHOR · 为什么在这一层重要
structured search,AlphaSAGE 灵感来源