论文笔记:DetNet:A Backbone network for Object Detection

DetNet是一种专为对象检测设计的网络结构,它在深层保持高空间分辨率,结合扩张卷积来增强定位能力。通过额外的阶段处理多尺度问题,其Fpn网络设计允许从深层获取小物体的语义信息。实验结果显示DetNet在目标检测任务中表现优秀。
摘要由CSDN通过智能技术生成

在这里插入图片描述

1.动机
  • 一些检测器通常包含了额外的 stages,处理多尺度问题
  • 较大的下采样因子会使感受野增大,空间分辨率降低,利于分类,不利于定位
  • 传统的 backbone 大多是针对做分类的

常见的backbone:
①Image Net
②AlexNet—为了减少计算量,增加有效的感受野,以32步长下采样 feature map
③VGG Net—以3*3卷积,构建更深的网络,也是32 strides
④Google Net 一 用起始块(inception block)来包含更多种特征
⑤Res Net一采用瓶颈结构设计,每个 Stage 都执行余数求和
⑥ResNext/Xeption—用群卷积层取代了传统的卷积层, 减少参数的同时提高了精度
⑦Dense Net 密集地连接卷积层,进一步减少参数,同时保持精度
⑧D RN (Dilated Residual Network )—用更少的步长来提取特征, 在语义分割上效果显著。

2.贡献点

创新
① 有 extra stages (像 FPM 和 Retinanet中),用于多尺度
② 深层仍保持高空间分辨率,利于定位

优点
既有高分辨率的 feature maps,又有大的感受野
利用了一个低复杂度的扩张形瓶颈结构

3.方案

在这里插入图片描述

F.B是传统分类主干网络,每次以stride2对feature map 进行下采样;F.A是Fpn网络,在原本下采样基础上进行上采样:它用深层检测大目标,浅层检测小目标,但是浅层含有的语意信息少,需要从深层上采样获得小物体的语意信息,但是,如果小目标的信息在下采样过程中就丢失了,那么上采样也采样不到

问题
① stages 数量不同
② 大物体观度低
③ 小物体不可见

4.DetNet Framework

在这里插入图片描述
①stage1-stage4和ResNet50都一样, stages 5开始不一样,P6 被用来检测大目标,stage 4之后仍保持16*下采样的空间分辨率
② 每个 stage 一开始先采用具有从1×1卷积投影的扩张型瓶颈
③ 将 dilated bottleneck 作为基本的网络板块,以有效地扩大感受野(dilated 卷积耗时-在 stage5和stage6中保持相同的channels)

5.实验方法和结果

在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值