文献阅读笔记6——《DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous ..》

0 写在前面

开源基于mmdetection

1 递归特征金字塔(RFP)

提出的递归特征金字塔(RFP)建立在特征金字塔上(FPN),通过额外的反馈链接从FPN层合并到自下而上的骨干层,将递归结构展开为顺序实现。该主干网络可以将图像查看两次或更多次。
(a)

  • (a)为FPN的经典结构
  • (b)中的连接线为RFP提出的反馈连接方式
  • (c)展示了RFP按顺序展开的网络反馈链接为第一次FPN各层输出经过ASPP输出与主干网络的各层链接。最终输出为两次FPN输出结果的融合。

A ASPP结构

ASPP带有空洞卷积的空间金字塔池化模块。

  • 去除了1*1卷积分支
  • 四个并行通道,前三个使用卷积层->ReLU=输出通道是输入通道的1/4。
  • 最后一个分支使用全局平均池化来压缩特征->1*1卷积层和ReLU将压缩后的特征转换为1/4。

空洞模块的配置kernel size = [1, 3, 3], atrous rate =[1, 3, 6], padding = [0, 3, 6]。

B ASPP输出与主干网络反馈连接结构

在这里插入图片描述
第一次FPN出来的feature map经过ASPP转换就是RFP Features
在这里插入图片描述
第二次出来的特征映射和第一次特征映射进行融合时,需要进行的操作。

2 可切换空洞卷积(SAC)

可将相同的输入特征与不同的的空洞率进行卷积,并使用切换功能来搜集结果。将自上而下的主干网络所有标准的3*3卷积层都换成SAC。

在SAC组件之前和之后都附加了两个全局上下文模式。主干网络中3*3都替换成SAC。

A 结构

B 锁定机制

原因:目标检测器通常使用预训练权值来初始化权重。 但是,对于从标准卷积层转换而来的SAC层,缺少较大atrous率的权重。 由于可以用相同的权重以不同的空洞率粗略地检测出不同尺度的目标,因此自然地用预训练模型中的权重来初始化丢失的权重是很自然的。

C 全局上下文机制

原因:
1.只有一个卷积层,没有任何非线性层
2.输出被加回到主流上,输入由sigmod计算的重新校准值。

3 baseline:HTC

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值