SPPNet详解（白话讲解——附图文）

liiiiiiiiiiiiike

于 2021-04-13 16:52:27 发布

阅读量1.3w

点赞数 10

分类专栏：深度学习 Python pytorch深度学习实战文章标签：神经网络计算机视觉卷积神经网络深度学习卷积

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45074568/article/details/115672200

版权

深度学习同时被 3 个专栏收录

73 篇文章

订阅专栏

47 篇文章

订阅专栏

pytorch深度学习实战

12 篇文章

订阅专栏

SPPNet是何凯明大神提出的，为了解决R-CNN中速度慢问题。

在神经网络中输入图片的尺寸必须是固定的，这是因为在设计的时候FC层中神经元的个数都是固定的，导致输入图片尺寸必须是固定的。

CNN是可以适应不同尺寸的输入图片，说明在CNN后面加入某种机制就可以让FC层也适应不同尺寸的输入图片，某种机制就是何凯明大神提出的空间金字塔池化（SPP）。

在这里插入图片描述

在最后的卷积层和全连接层之间加入SPP层。具体做法是，在conv层得到的特征图是256层，每层都做一次spatial pyramid pooling。先把每个特征图分割成多个不同尺寸的网格，比如网格分别为44、22、11,然后每个网格做max pooling，这样256层特征图就形成了16256，4256，1256维特征，他们连起来就形成了一个固定长度的特征向量，将这个向量输入到后面的全连接层。

R-cnn中将2000个框输入到神经网络中，而SPPNet中将整张图片丢到神经网络中，得到原图的feature map，而在R-CNN中有候选框，我们就可以将feature map中可能存在物体的候选框截取下来，这时截取出来的框尺寸会不同，但是通过SPP后，就被固定为长度一定的特征向量，将向量输入到后面的FC层。

SPPNet可以将数据集缩放这样就起到了增加数据集了，SPPNET后面和R-cnn差不多一致。

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

liiiiiiiiiiiiike 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。