是对Sparse R-CNN的改进
Sparse R-CNN是近期通过对稀疏,可学习提议框和提议特征进行集合预测的一种强大的目标检测方法。在该篇文章中,提出了两种动态设计(DLA和DPG)来改进Sparse R-CNN。
DLA动态标签分配
为什么:作者认为在Sparse R-CNN中基于匈牙利算法的一对一匹配不是最优的,所以提出一个多对一分配的假设来更有效地优化proposals并促进检测器训练。
实现:遵循基于 CNN 的方法 , 并在 Transformer 中应用最优传输分配(OTA)。OTA 是一种探索检测框应如何与基本事实相匹配的公式。该法将ground truth视为供应商提供分配配额,将检测框视为需求方寻求分配。背景类被制定为提供默认分配的供应商。
优化目标