SPPNet详解(白话讲解——附图文)

SPPNet是何凯明大神提出的,为了解决R-CNN中速度慢问题。

在神经网络中输入图片的尺寸必须是固定的,这是因为在设计的时候FC层中神经元的个数都是固定的,导致输入图片尺寸必须是固定的。

CNN是可以适应不同尺寸的输入图片,说明在CNN后面加入某种机制就可以让FC层也适应不同尺寸的输入图片,某种机制就是何凯明大神提出的空间金字塔池化(SPP)。

在这里插入图片描述

在最后的卷积层和全连接层之间加入SPP层。具体做法是,在conv层得到的特征图是256层,每层都做一次spatial pyramid pooling。先把每个特征图分割成多个不同尺寸的网格,比如网格分别为44、22、11,然后每个网格做max pooling,这样256层特征图就形成了16256,4256,1256维特征,他们连起来就形成了一个固定长度的特征向量,将这个向量输入到后面的全连接层。

R-cnn中将2000个框输入到神经网络中,而SPPNet中将整张图片丢到神经网络中,得到原图的feature map,而在R-CNN中有候选框,我们就可以将feature map中可能存在物体的候选框截取下来,这时截取出来的框尺寸会不同,但是通过SPP后,就被固定为长度一定的特征向量,将向量输入到后面的FC层。

SPPNet可以将数据集缩放这样就起到了增加数据集了,SPPNET后面和R-cnn差不多一致。

  • 9
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

liiiiiiiiiiiiike

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值