2020CVPR-目标检测论文解读之FSOD:Few-Shot Object Detection with Attention-RPN and Multi-Relation Detector
1.摘要
传统的目标检测方法通常需要大量的训练数据,而准备这样高质量的训练数据是非常劳动密集的。本文提出了一种新的少镜头目标检测网络,该网络只需少量的标注实例,就可以检测出不可见类的目标。该方法的核心是注意RPN、多关系检测器和对比训练策略,利用少量镜头支持集和查询集的相似性来检测新的目标,同时抑制背景中的错误检测。为了训练我们的网络,我们提供了一个新的数据集,其中包含1000个具有高质量注释的各种对象类别。据我们所知,这是第一个专门为少数镜头对象检测而设计的数据集。一旦我们的少量镜头网络被训练,它就可以检测出未被观察到的类对象,而无需进一步训练或微调。该方法具有通用性和广泛的应用前景。我们在不同的数据集上,在少数镜头设置下,产生了一个新的最先进的性能。
2.引言
现有的目标检测方法通常依赖于大量的标注数据,需要较长的训练时间。这推动了近年来少镜头目标检测技术的发展。由于真实世界中物体的光照、形状、纹理等变化很大,因此少镜头学习是一项挑战。虽然已有了大量的研究和进展,但这些方法都集中在图像分类上,很少涉及到目标的检测问题,很可能是因为从少量镜头分类到少量镜头目标的检测是一项非常艰难的任务。仅给出少量镜头的目标检测的核心是如何在