Towards Large-Scale Small Object Detection: Survey and Benchmarks
论文简介:
随着深度卷积神经网络的兴起,目标检测取得了显著的进展。然而小物体检测(SOD)的性能仍不令人满意,因此这是计算机视觉中具有挑战性的任务之一,因为小目标的内在结构造成的视觉外观和嘈杂的表征。
此外,用于基准测试小对象检测方法的大规模数据集仍然是一个瓶颈。在本文中,作者首先对小物体检测算法进行了彻底的回顾。然后,为了促进SOD的发展,作者构建了两个大规模的小物体数据集SODA-D和SODA-A,分别关注于驾驶和空中场景。
其中SODA-D包括24704张高质量的交通图像和9个类别的277596个实例。对于SODA-A,作者收集了2510张高分辨率航空图像,并超过9类注释了80020个3个实例。所提出的数据集是第一次尝试使用为多类别SOD定制的大量详尽注释的实例来进行大规模基准测试。
最后作者评估了主流方法在SODA上的性能。
论文动机:
虽然在通用目标检测方面取得了实质性的进展,但SOD的研究进展相对较缓慢。更具体地说,即使是领先的探测器,在检测小型和正常大小的物体方面仍然存在巨大的性能差距。
以最先进的检测器之一DyHead为例,DyHead在COCO测试集上获得的小物体的平均平均精度(mAP)度量仅为28.3%,明显落后于中大尺寸的物体(分别为50.3%和57.5%)。
作者假设这种性能下降源于以下两个方面:
- 从有限和扭曲的小对象信息中