Multi-Object Tracking Survey
Multi-Object Tracking Survey
来自论文:"Deep Learning in Video Multi-Object Tracking: A Survey", 作者是来自意大利和西班牙等院校的Gioele Ciaparrone等人。论文引用[1]:Ciaparrone, Gioele et al. “Deep learning in video multi-object tracking: A survey.” Neurocomputing 381 (2019): 61-88.
总结
多目标跟踪的问题是指在一个序列中跟踪不同目标的轨迹,通常是一个视频。近些年随着深度学习的兴起,算法从深度模型的表征能力中收益。本文提供了提供了用深度学习模型来解决MOT问题的全面的综述。
MOT问题不同于目标检测(输出一系列的bounding box)。MOT算法还将target ID和每个box(detection)进行关联,为了区分类内的目标。单目标跟踪中,目标的外观是已知的先验,在MOT中,检测这一步对于识别targets是必须的,追踪多个目标的主要困难在于多样的阻塞和目标之间的交互,有时它们还有相似的背景。因此,将单目标跟踪应用于多目标跟踪会导致目标漂移和多个ID切换,这样的模型通常在区分相似目标和类内目标的时候有困难。专门针对多目标跟踪的一系列的算法被调整出来,用于解决这个问题,还有数据benchmarks和比赛,来方便不同方法的对比。 最近,很多的算法用深度学习来做,深度学习模型的长处在于学习丰富表征和提取特征。卷积神经网络长处在于空间模式提取,循环神经网络想LSTM用于处理时序数据。