MeMOTR
MeMOTR: Long-Term Memory-Augmented Transformer for Multi-Object Tracking[1]
作者是来自南京大学的Ruopeng Gao和Limin Wang。论文引用[1]:Gao, Ruopeng and Limin Wang. “MeMOTR: Long-Term Memory-Augmented Transformer for Multi-Object Tracking.” 2023 IEEE/CVF International Conference on Computer Vision (ICCV) (2023): 9867-9876.
Time
- 2024.Feb
Key Words
- long-term temporal information
总结
- MOT是希望能够有效地得到目标的时序信息。不幸地是,现有的方法只显式地利用了相邻帧的目标特征,然而缺乏建模长程信息的能力。在本文中,提出了MeMOTR,一个长程的记忆增强的Transformer,用于多目标跟踪。作者的方法是,通过利用带有customized memory-attention layer的长期的记忆,能够使相同目标的track embedding更加stable和distinguishable。这显著提高了模型的目标关联能力。