极简笔记 DetNet: A Backbone network for Object Detection
文章的核心提出了一种专用于detection任务的backbone network:DetNet。目前检测网络的主流方法是基于classification网络加FPN和RPN结构进行定位。大部分分类网络通过减小深层的spatial size 来加大像素的感受野,较小的resolution一定程度影响了大物体定位的准确性。文章提出的DetNet在网络深层使用rate=2的空洞卷积替代原有bottleneck的3x3卷积,在不缩小spatial size,小幅增加计算量的同时增加像素感受野,以增加检测的准确性。为了减小计算量,深层部分的channel数停留在256没有增加。
文章的主要对比实验室ResNet50-FPN结构,因此构造了对应的DetNet59结构,大致结构对比如上图。DetNet是对骨架网络进行改造,因此可以同理加上FPN结构。因为DetNet59的计算量(FLOPs-4.8G)还是会比ResNet50的计算量(FLOPs-3.8G),有人可能会说提高的性能是由于更大的计算量带来的,于是文章又加了ResNet101(FLOPs-7.6G)的对比实验,显示在det任务上DetNet以更少的计算量取得了更高的检测结果。