极市平台(微信公众号ID:extrememart):专注计算机视觉前沿资讯和技术干货。本文由极市平台首发,转载需获授权。
论文地址:https://arxiv.org/abs/2006.02334代码地址(基于mmdetection实现):https://github.com/joe-siyuan-qiao/DetectoRS
本文是
谷歌团队
提出的最新的目标检测方案,并且已经完全开源。整个算法将递归特征金字塔(RFP,Recursive Feature Pyramid)和可切换的空洞卷积(SAC,Switchable Atrous Convolution)结合在一起,在COCO test-dev目标检测任务中,达到了54.7% box AP,相比之前提升1.4 AP,性能强悍。
简介
目标检测一直都是计算机视觉中最值得关注的领域,从经典的两阶段(论文中将其概括为两次looking和thinking机制)方法Faster RCNN、单阶段的YOLO系列、SSD系列,到近段时间性能卓越的EfficientDet、CBNet、ResNeSt等,可以看出,通过backbone结构的改进来提升目标检测的性能是目前涨点和研究的新热点,值得大家关注与创新。
而在本文中,DetectoRS同样从backbone的角度出发,对目标检测性能进行强化,具体来说有两大部分的创新:
1、首先,DetectoRS在宏观层面上,提出了递归特征金字塔(RFP,Recursive Feature Pyramid),它将特征金字塔网络(Feature Pyramid Networks)的额外反馈连接加入到在自下而上的骨backbone层中。
2、其次,DetectoRS在微观层面上,提出了可切换的空洞卷积(SAC,Switchable Atrous Convolution),它以不同的空洞率(rate)对特征进行卷积,并使用switch函数合并卷积后的结果,SAC可以实现从标准卷积到Contional卷积的有效转换,而无需更改任何预训练模型。
将递归特征金字塔(RFP,Recursive Feature Pyramid)和可切换的空洞卷积(SAC,Switchable Atrous Convolution)合并形成了DetectoRS,大大增强了目标检测的性能。具体来说,在COCO test-dev数据集上达到了54.7% box AP的SOTA性能,同时在COCO实例分割任务上达到47.1% m