目标检测系列:couplenet

论文链接:CoupleNet: Coupling Global Structure with Local Parts for Object Detection

1.Introduction

本文算是RFCN的一个改进方法,RFCN提出在目标检测中引入位置敏感得分图,去除了ROIPooling后不共享的部分,在速度和精度都取得了不错的效果,但是RFCN并没有考虑全局信息,因此本文针对这个问题进行改进,贡献如下:

  1. 提出全卷积网络,同时将全局信息和局部信息相结合
  2. 设计了一个不同的normalization和coupling策略挖掘局部信息和全局信息的兼容性和互补性
  3. 实验精度很高

2.CoupleNet

2.1网络结构

如下图所示,整体看可以分为两部分,上半部分是考虑局部信息的全卷积网络,称之为local FCN,下部分考虑了全局的信息,称之为global FCN。网络的主干使用Rsenet101,去除了avg poolling和fc层,经过RPN得到的proposal regions流向上下两部分,最后local FCN和global FCN相结合决定输出。
在这里插入图片描述
Local FCN
这部分就是 RFCN,参见https://blog.csdn.net/qq_39068872/article/details/104946052

global FCN
这部分也分为上下两部分,上面的是对RPN推荐出的proposal regions进行ROI Pooling操作,统一大小,下面这部分是全局信息,虽然说通过将更高层上采样可以得到全局信息,但是信息丢失严重,考虑全局信息很有必要,这里的全局信息是指proposal region对应区域二倍大小的区域,都通过ROIPooling后按通道连接在一起,然后接上两个卷积层,很明显,第一个kxk的卷积将特征图变成1x1的大小,后面的1x1conv将通道变成(c+1)的向量,下面要进行标准化,有两种方案1.使用L2 normalization。2.使用1x1卷积。然后将local FCN和global FCN进行拼接,有三种候选方案1.按位相加(element-wise sum)。2.按位相乘(element-wise product)。3.按位取最大(element-wise maximum)。最后通过实验证明最佳方案是1x1conv+element-wise sum
在这里插入图片描述

3.实验

在这里插入图片描述
上图是不同的normalization和拼接组合方式进行实验的结果,从表中发现,使用L2比不是用精度还降低了,如果使用1x1 conv相对于不用精度上升0.6,而拼接方式,很明显element sum全面领先。

总结

本文算是对RFCN的改进,在使用RFCN的同时,考虑全局信息,这给我们提了个醒,可以在别的方法中添加更对的全局信息,同时,在normalization的时候,适当多使用1x1conv会对结果产生很不错影响,这个问题值得注意

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值