Beyond Skip Connections: Top-Down Modulation for Object Detection阅读笔记

Beyond Skip Connections: Top-Down Modulation for Object Detection



   此图是整个文章的框架图。

1:Top-Down Modulation (TDM)

      TDM模块由两部分组成,T模块与L模块(侧面模块),下面详细介绍下这个模块。


 1.1 L模块(lateral module)

        L 模块的作用是将上一层的特征xiC通过一些操作将其转换为xiL特征。L模块负责学习怎样转换底层特征。其中T模块与L模块都可以是小的网络,可以是一层或者多层。作者选择了单一的非线性卷积模块。这里的L.模块是一个3*3的卷积,以及非线性RELU激活函数。

1.2 T模块

       T模块的作用是将xiL特征与上一个T模块作用后的结果xiT混合,并进行相应的操作,输入特征作为下个T模块的输入。T模块负责学习上一个T模块中哪 些信息是需要保留的其中包含了需要学习如何选择L模块的特征。这里的T模块选择的是一个3*3的卷积以及RELU函数。需要注意的是如果下一个L模块,(如正在处理的L3模块,下一模块就是L2模块)的维度高于正在处理的模块,T模块要进行上采样使其维度相等。如果相等就不需要采样。其中T模块与L模块都可以是小的网络,可以是一层或者多层。作者选择了单一的非线性卷积模块。

最后的Tiout模块被用来检测任务。Tiout模块由1*1的卷积和RELU激活函数层组成。例如,图2中,在faster-rcnn框架中,用T2out模块代替X5C模块作为ROI proposal与ROI 分类器的输入。在训练过程中,梯度更新流向从最后的目标检测器反馈到T,L模块,L模块再反馈给C模块。

2:训练

  作者选择了两个模型来验证TDM模块的作用,其中一个是VGG16,另一个就是ResNet101。

2.1 VGG16

  VGG16网络,conv1到conv5_3为基础网络,另外两个FC层为分类工作服务。作者从conv1_x开始添加TDM模块。

2.2 ResNet101

  ResNet101,作者改变了con3_x的pooling stride为1,作者添加在conv4_x后con3_x后添加了TDM模块。详细看下表


3:结果

看论文吧



其中T模块与L模块都可以是小的网络,可以是一层或者多层。作者选择了单一的非线性卷积模块。
  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值