SPP-net

    参考文献:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

    SPP-net的思路其实很简单,就是为了解决传统卷积神经网络在含有FC(全连接层)的时候,只能输入固定尺寸的图片的弊端。在传统带有FC的网络中,若想输入不同尺寸的图片,必须先将它们进行裁剪或resize。

如何实现SPP:

    我们知道,卷积层和池化层对于特征的尺寸是没有要求的,也就是可以输入任意尺寸的特征,只不过网络在建好后,输入不同尺寸的特征则输出尺寸也不一样。而全连接层对于输入特征的尺寸有着严格的要求。基于此,作者的思路就是:在网络的最后一层卷积层(conv_5)之后,将原来的pooling层换成Spatial Pyramid Pooling层,目的是把不同尺寸的conv_5的输出,变成相同尺寸的FC的输入。实现过程其实也很简单:

1.  首先我们有conv_5的输出特征(比如13x13尺寸)

2.  构建多层金字塔(比如三层),利用金字塔将原始特征分成1x1,2x2,4x4等不同尺度

3. 对于每个金字塔中的每块小区域,求取其最大pool,作为此小区域的特征输出

4. 则总共对应的输出尺寸为:1+4+16=21

因此,SPP能够将任意尺寸的输入,经过空间金字塔池化结构,将输出特征统一规划为相同的尺寸,以供后面的FC输入。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值