SSP-Net 论文笔记

最新推荐文章于 2022-04-24 16:17:09 发布

programmingfool5

最新推荐文章于 2022-04-24 16:17:09 发布

阅读量3.6k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/programmingfool5/article/details/82667581

SPP-Net（Spatial Pyramid Pooling Network）通过多级池化操作解决了卷积神经网络中全连接层需要固定尺寸输入的问题。这种方法增强了网络对目标形变的鲁棒性，并在目标检测任务中减少了计算量，例如在R-CNN基础上，不需要对每个候选区域单独进行卷积。通过SPP层，网络可以从不同尺度的特征中学习，提高了模型的泛化能力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这篇文章的主要解决的是当输入的图片的尺寸不是既定的 $224 \times 224$ , 采用各种对图片放缩的时候会影响网络的学习. 比如下图, 只裁剪了一部分, 或者放缩的时候发生了几何的形变:

这里写图片描述
那么为什么会要求输入的大小相同呢, 很大一个原因就是最高层的FC的输入的尺寸必须要相同. 文章就是从这里下手的.

Spatial pyramid pooling: 指的是对于卷积学得的N个feature maps进行多次池化操作, 并且池化核的大小逐渐增大, 这会导致着池化的输出逐渐减小,(像金字塔形状一样) 将这些池化后的输出合并起来, 作为FC的输入, 以此来解决FC要求的输入必须要一致的问题.

SPP层原理如下所所示，假定CNN层得到的特征图大小为 $a\times a$ （比如 $13\times 13$ ，随输入图片大小而变化），设定的金字塔尺度为

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。