SPP-net阅读随笔


(注:编辑器会根据文章标题自动生成目录)

SPP-net介绍

RCNN将卷积神经网络应用于目标检测之后,关于神经网络在目标检测领域的研究也就逐渐增多,SPP-net就RCNN对每个Region Proposal都进行卷积运算消耗太多计算量的问题,提出空间金字塔的概念,即SPP-net。

RCNN的问题

RCNN缺点,RCNN方法中,卷积需要固定尺寸的输入,即输入的region尺寸大小要符合要求,不符合就要裁剪或warp,对于形状大小不一的region proposal进行裁剪等操作可能导致内容丢失以及失真,于是影响检测效率。另外,对每一张图片的所有region proposal都进行卷积提取特征,这个计算量非常大。
下图为RCNN和SPP-net即操作流程对比。
在这里插入图片描述

SPP-net的解决方案

考虑到RCNN提取特征模块有CNN和全连接层,真正需要固定尺寸输入的是全连接层,CNN的输入尺寸并没有要求,只是CNN对于不同尺寸的输入输出的feature map大小不一。所以我们在CNN与全连接层之间加上一个SPP-NET(pooling操作,代替原来的pool5,这既是空间金字塔)得,它可以将不同尺寸的输入改为固定尺寸的输出。

另外不同于RCNN对一张图像的每一个region proposal都进行卷积运算,该论文只对一张图进行一次卷积操作,然后在卷积到的feature map 上使用SPP-net提取特征,这样可以使时间损耗大大降低,即可兼得灵活性和CNN的强大能力。

空间金字塔SPP-net

对于SPP-net如何实现接受任意输入而输出固定输出的呢?

对于a×a的feature map作为空间金字塔输入,为了取得n×n的输出,可以pool window为a/n,straide为a/n。例如,例如对于13×13的输入,为了得到3×3,2×2以及1×1,我们分别按如图一取pool window大小以及straide步长,这样既可保证输出尺寸不变。

这里选用了三个SPP,将其拼接到一起即可得到一个固定维度的输出,如图二所示,拼接多个SPPnet的好处是可以整合全局信息和局部信息,极大程度上减少了信息丢失对形变和空间布局更加鲁棒。值的一提的是,当仅仅加上SPP而不加其他操作的时候也可以提高准确率,说明其
图一
图二

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值