SPP-Net论文详解

最新推荐文章于 2024-07-23 22:38:19 发布

v1_vivian

最新推荐文章于 2024-07-23 22:38:19 发布

阅读量5.8w

点赞数 106

分类专栏：论文阅读深度学习文章标签：神经网络 SPP-Net 机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/v1_vivian/article/details/73275259

版权

SPP-Net是出自2015年发表在IEEE上的论文-《Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition》。

在此之前，所有的神经网络都是需要输入固定尺寸的图片，比如224*224（ImageNet）、32*32(LenNet)、96*96等。这样对于我们希望检测各种大小的图片的时候，需要经过crop，或者warp等一系列操作，这都在一定程度上导致图片信息的丢失和变形，限制了识别精确度。而且，从生理学角度出发，人眼看到一个图片时，大脑会首先认为这是一个整体，而不会进行crop和warp，所以更有可能的是，我们的大脑通过搜集一些浅层的信息，在更深层才识别出这些任意形状的目标。

为什么要固定输入图片的大小？

卷积层的参数和输入大小无关，它仅仅是一个卷积核在图像上滑动，不管输入图像多大都没关系，只是对不同大小的图片卷积出不同大小的特征图，但是全连接层的参数就和输入图像大小有关，因为它要把输入的所有像素点连接起来,需要指定输入层神经元个数和输出层神经元个数，所以需要规定输入的feature的大小。
因此，固定长度的约束仅限于全连接层。以下图为例说明：

作为全连接层，如果输入的x维数不等，那么参数w肯定也会不同，因此，全连接层是必须确定输入，输出个数的。

SPP-Net是如何调整网络结构的？

最低0.47元/天解锁文章

关注

106
点赞
踩
409

收藏

觉得还不错? 一键收藏
35
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

v1_vivian CSDN认证博客专家 CSDN认证企业博客

码龄10年

40: 原创

12万+: 周排名

165万+: 总排名

45万+: 访问

: 等级

3115: 积分

328: 粉丝

443: 获赞

180: 评论

1461: 收藏

私信

关注

热门文章

分类专栏

最新评论

SPP-Net论文详解
草洛白: 我也有该疑问很迷惑qaq 所以到底能不能直接输入都不一样尺寸的图片呢
SPP-Net论文详解
woe007: 因为RCNN是对每个候选框做一次cnn，而SPP-net对整图一次cnn，但还要找到对应候选框的区域，此时候选框的大小不一，所以用SPP产生固定大小输出。整图的cnn提取的是相对整图的特征，全局特征，后续对候选框区域再提取特征提取的就是候选框区域的，粒度更细。SPP里面还会进行多尺度的特征提取
SPP-Net论文详解
Joker_DDDu: 感觉你说的不太对既然我们都通过cnn提取出来了整张图片的特征，为何又要通过ss的区域进行特征提取，spp层的作用不是用来产生固定大小的输出的嘛
SPP-Net论文详解
keep learning1: 好文，点赞收藏了
SPP-Net论文详解
keep learning1: 为什么最开始是输出21维特征，多尺度训练时又输出14维特征？

大家在看

最新文章

目录

评论 35

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。