论文链接:DetNet: A Backbone network for Object Detection
ECCV2018
一个专门为物体检测任务而设计的 Backbone——DetNet
论文主要是讨论设计检测的backbone
考虑到分类问题和检测问题之间的差异,使用分类的backbone来做分类任务有两个问题:
- 最新的检测器与分类的backbone相比,为了获取多样的sizes,基本都增加了额外的stages。
- 传统的backbone基于大的下采样倍数,以获取更大的感受野,这有利于图像的分类,但不利于目标的精确定位、识别小物体。
提出新的backbone,DetNetDetNet包含了额外的层,不仅保留了高分辨率的特征,而且保留了大的感受野。
DetNet
Resnet50 作为baseline,共有stage1-5。DetNet保留ResNet的 1-4stage ,在stage 4 之后就固定下采样倍数为16x,增加了额外的stage 6。
其设计细节如下:
- stage4-6这三个stage的stride都是16,而ResNet50的stage5的特征图是原图尺寸的1/32,见图1
- 提出了dilated bottleneck,分成A和B两种,见图2-D;
- dilation技术增大了感受野,然而考虑到计算量和内存,stage5和stage6保持了相同的通道数目(256的输入通道,而不是像传统的backbone一样,每个阶段通道数增加一倍)
Result
为了进一步检验DetNet在目标检测上的性能,基于DetNet-59和ResNet-50的FPN从头进行训练,也就是说不使用ImageNet上的预训练参数对比,这也就进一步证明了DetNet更适合于目标检测。