DN-DETR
DN-DETR: Accelerate DETR Training by Introducing Query DeNoising[1]
作者是来自hkust等机构的Feng Li、Hao Zhang等人。论文引用[1]:Li, F., Zhang, H., Liu, S., Guo, J., Ni, L.M., & Zhang, L. (2022). DN-DETR: Accelerate DETR Training by Introducing Query DeNoising. 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 13609-13617.
Time
- 2022.Dec
Key Words
- Denosing Training
- 一句话来说:作者发现DETRs方法收敛慢的一个主要原因在于bipartite matching,这个matching训练的时候不稳定。于是增加了denoising training for boxes和labels,能够加速收敛,提高了性能。
总结
- 作者展示了denosing training的方法,能够加速DETR的训练,提供了对于DETR-like方法的收敛慢的深刻的理解。作者展示了收敛慢是由于bipartite matching的不稳定造成早期阶段的不一致优化目标。为了解决这个问题,除了匈牙利loss,作者的方法额外的将带有噪声的GT bboxes给到Transformer decoder中,训练模型来重建original boxes,能够有效地降低bipartite graph matching的困难,导致更快的收敛。作者的方法是通用的,能够很容易地插入到任何DETR-like的模型中,实现很好的提升。