Mamba

Notes

  1. SSM是用于描述这些状态表示,并根据某些输入预测其下一个状态可能是什么的模型,一般的输入是连续序列。SSM的核心方程: \[ \begin{align*} \text{State equation} & \quad h'(t) = A h(t) + B x(t) \\ \text{Output equation} & \quad y(t) = C h(t) + D x(t) \end{align*}\] 为了能够处理离散数据,对离散数据进行连续化,使用零阶保持技术,zero-order hold(ZOH)。有了连续的信号,就可以根据输入的时间对值进行采样。通过HiPPO初始化,处理长距离依赖

References

  • https://blog.csdn.net/v_JULY_v/article/details/134923301