GHOST
Simple Cues Lead to a Strong Multi-Object Tracker[1]
作者是来自慕尼黑工业大学和慕尼黑机器学习中心的Jenny Seidenschwarz等人,论文引用[1]:Seidenschwarz, Jenny et al. “Simple Cues Lead to a Strong Multi-Object Tracker.” 2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) (2022): 13813-13823.
Time
- 2023.Apr
Key Words
- domain-specific knowledge
- 一句话来说:在之前的TbD的范式基础上,提出了两个方案:一个是实时域适应:对于reID,源数据集的statistics可能和target ones不匹配,对于MOT任务,每个sequence的statistics可能都不一样,代表着一个新的domain,所以用one-the-fly DA来防止reID models应用在不同的sequences上的时候的性能退化。这里作者用了current batch的均值和方差来更新BN layer;另外,在计算distance computation的时候,对active tracks和inactive tracks分开处理,用不同match threshold 来处理active tracks和inactive tracks。
总结
- 很长时间以来,MOT中的大多数的范式是Tracking-by-detection(TBD)。目标先进行检测,然后关联。对于关联,大多数的模型利用motion和外观cues,例如reid。最近基于attention的方法提出用数据驱动的方式来学习cues。有很好的效果。这篇文章中,作者提出了疑问:简单的TBD的方法能够也实现端到端的性能。作者提出了两个关键的要素,使得标准的reid网络在基于外观的跟踪方面表现出色。作者分析了它的失败的情况,将appearance features和简单的运动模型结合会有一个很好的跟踪结果。