← 返回论文库

GFlowNet: Generative Flow Networks

Bengio, et al. (Mila) · 2021
L5.2 · Algorithmic FoundationsNeurIPS 2021 / JMLR 2023#search#generative
CORE IDEA
学到和 reward 成比例的 distribution 而非 argmax policy,explore 多 mode。
L-ANCHOR · 为什么在这一层重要
structured search,AlphaSAGE 灵感来源
arXiv:2106.04399

相关论文