← 返回论文库
AlphaSAGE: GFlowNet-based Alpha Mining
— · 2025
L0.3 · Financial AgentsarXiv:2509.25055#alpha-mining#gflownet
CORE IDEA
用 GFlowNet 替代 RL/GP:学到和 reward 成比例的 distribution 而非 argmax,能 explore 多个 high-reward mode。
CONCRETE EXAMPLE
GFlowNet trajectory 比 PPO 找到的 high-reward mode 多 3-5 倍。
L-ANCHOR · 为什么在这一层重要
GFlowNet 路线,是 RL 之外的 viable 选择