← 返回论文库
Mamba: Linear-Time Sequence Modeling with Selective State Spaces
Gu, Dao (CMU + Princeton) · 2023
L4.1 · Foundation Model Tech StackarXiv:2312.00752#architecture#ssm
CORE IDEA
Selective SSM:sub-quadratic 序列建模,挑战 Transformer 在长序列任务上的统治。
L-ANCHOR · 为什么在这一层重要
post-Transformer 候选