&Title
&Summary
许多现代的物体检测器通过使用两次观察和思考的机制展示了出色的性能。 在本文中,我们探索了用于目标检测的主干设计中的这种机制。 ’
- 在宏级别,我们提出了递归特征金字塔,它结合了从特征金字塔网络到自下而上的骨干层的额外反馈连接。
- 在微观层面上,我们提出了可切换的Atrous卷积,它以不同的atrous速率对特征进行卷积,并使用switch函数收集结果。
将它们组合在一起可产生DetectoRS,从而大大提高了对象检测的性能。
在COCO测试开发中,DetectoRS达到了用于对象检测的54.7%的box AP,用于实例分割的47.1%的mask AP和用于全景分割的49.6%的PQ。
&Research Objective
looking and thinking twice in backbone
&Problem Statement
受人类视觉系统的启发,计算机视觉中已实例化了两次查看和思考的机制,并显示了出色的性能。
- 许多流行的两阶段目标检测器,例如Faster R-CNN [58],首先输出目标提议,然后根据该提议提取区域特征以检测目标。
- Cascade R-CNN [5]开发了一个多级检测器,在此之后的检测器头部将通过更多选择性示例进行训练。
这种设计理念的成功促使我们在用于对象检测的神经网络主干设计中进行探索。