论文笔记：DetNet：A Backbone network for Object Detection

最新推荐文章于 2021-07-08 18:54:02 发布

philipwelia

最新推荐文章于 2021-07-08 18:54:02 发布

阅读量335

点赞数

分类专栏：论文笔记文章标签：网络卷积计算机视觉深度学习算法

本文链接：https://blog.csdn.net/qq_42499257/article/details/105731979

版权

论文笔记专栏收录该内容

8 篇文章 0 订阅

订阅专栏

DetNet是一种专为对象检测设计的网络结构，它在深层保持高空间分辨率，结合扩张卷积来增强定位能力。通过额外的阶段处理多尺度问题，其Fpn网络设计允许从深层获取小物体的语义信息。实验结果显示DetNet在目标检测任务中表现优秀。

摘要由CSDN通过智能技术生成

在这里插入图片描述

1.动机

一些检测器通常包含了额外的 stages,处理多尺度问题
较大的下采样因子会使感受野增大，空间分辨率降低，利于分类，不利于定位
传统的 backbone 大多是针对做分类的

常见的backbone：
①Image Net
②AlexNet—为了减少计算量，增加有效的感受野，以32步长下采样 feature map
③VGG Net—以3*3卷积，构建更深的网络，也是32 strides
④Google Net 一用起始块（inception block)来包含更多种特征
⑤Res Net一采用瓶颈结构设计，每个 Stage 都执行余数求和
⑥ResNext/Xeption—用群卷积层取代了传统的卷积层，减少参数的同时提高了精度
⑦Dense Net 密集地连接卷积层，进一步减少参数，同时保持精度
⑧D RN (Dilated Residual Network ）—用更少的步长来提取特征, 在语义分割上效果显著。

2.贡献点

创新
① 有 extra stages （像 FPM 和 Retinanet中），用于多尺度
② 深层仍保持高空间分辨率，利于定位

优点
既有高分辨率的 feature maps，又有大的感受野
利用了一个低复杂度的扩张形瓶颈结构

3.方案

在这里插入图片描述

F.B是传统分类主干网络，每次以stride2对feature map 进行下采样；F.A是Ｆｐｎ网络，在原本下采样基础上进行上采样：它用深层检测大目标，浅层检测小目标，但是浅层含有的语意信息少，需要从深层上采样获得小物体的语意信息，但是，如果小目标的信息在下采样过程中就丢失了，那么上采样也采样不到

问题
① stages 数量不同
② 大物体观度低
③ 小物体不可见

4.DetNet Framework

在这里插入图片描述
①stage1-stage4和ResNet50都一样， stages 5开始不一样，P6 被用来检测大目标，stage 4之后仍保持16*下采样的空间分辨率
② 每个 stage 一开始先采用具有从1×1卷积投影的扩张型瓶颈
③ 将 dilated bottleneck 作为基本的网络板块,以有效地扩大感受野（dilated 卷积耗时-在 stage5和stage6中保持相同的channels）