SPP网络论文通读

作用

SPP可以无限制输入大小
1

结构

SPP层将放在卷积层后面,SPP层会将卷积层输出的特征,生成固定尺寸,输入全连接层。

对于深度CNNs,SPP有几个显著的属性:

  1. SPP可以不管输入大小而生成固定尺寸,而之前的深度网络使用的滑动窗口不能。
  2. SPP使用了多级空间箱,而滑动窗口只有单一的窗口大小。多级池化被证明了对于对象变现有鲁棒性(健壮性)
  3. 由于输入尺度的灵活性,SPP可以汇聚不同尺度提取的特征。

开发一种多尺度的训练方法:
为了一个网络可以接受多尺度输入,我们通过多个网络共享全部参数近似它,就是这些网络里面每个网络都用一种尺度输入。在这一轮输入一种固定大小,下一轮就换另外一种固定大小。
实验证明:多尺度比传统的单尺度训练更容易收敛,并精确度更高。
2

过程

卷积层可以接受任意的输入大小,但是他们会产生不同的输出大小。分类器或全连接层要求固定向量。
3

  1. 输入224*224的图片
  2. 卷积后得到一个13*13的特征图,a=13
  3. 定义一个3级的pyramid pooling(3*3, 2*2, 1*1),n=3,2,1
  4. 计算滑动窗口向上取整的a/n=5,7,13
  5. 计算步长是向下取整的a/n=4, 6, 13
  6. 经过SPP卷积得出4*4*256-d, 2*2*256-d,1*1*256-d;256-d是256层特征图
  7. iutputs=(16+4+1)*256

如果第一步是180*180的图片,经过SPP卷积得出4*4*256-d, 2*2*256-d,1*1*256-d;
所以是多尺度图片都可以用固定的大小输入FC层。

实验

4

实验证明:有SPP比无SPP错误率低,多尺度训练比单尺度训练的错误率低
5实验证明:在使用SPP的情况下,原图效果更好

6
7

实现证明:在单网络的情况下,在验证集取得最好的结果,并在ILSVRC2014上取得第三名。

8

9
实验证明:在不同的数据集,保持原图取得效果最好

速度快

相比于R-CNN,速度为什么会快这么多?
因为R-CNN先在图像上提取候选图,再卷积提取特征,就是说如果有1k候选图,就要进行1k次卷积,提取候选框特征;
而SPP就是先对一整张图进行1次卷积得出特征图,在特征图上提取候选框,直接获取候选框特征;比较下,SPP直接省去1k-1次卷积。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值