SSP-Net 论文笔记

SPP-Net(Spatial Pyramid Pooling Network)通过多级池化操作解决了卷积神经网络中全连接层需要固定尺寸输入的问题。这种方法增强了网络对目标形变的鲁棒性,并在目标检测任务中减少了计算量,例如在R-CNN基础上,不需要对每个候选区域单独进行卷积。通过SPP层,网络可以从不同尺度的特征中学习,提高了模型的泛化能力。
摘要由CSDN通过智能技术生成

这篇文章的主要解决的是当输入的图片的尺寸不是既定的 224×224 224 × 224 , 采用各种对图片放缩的时候会影响网络的学习. 比如下图, 只裁剪了一部分, 或者放缩的时候发生了几何的形变:

这里写图片描述
那么为什么会要求输入的大小相同呢, 很大一个原因就是最高层的FC的输入的尺寸必须要相同. 文章就是从这里下手的.

Spatial pyramid pooling: 指的是对于卷积学得的N个feature maps进行多次池化操作, 并且池化核的大小逐渐增大, 这会导致着池化的输出逐渐减小,(像金字塔形状一样) 将这些池化后的输出合并起来, 作为FC的输入, 以此来解决FC要求的输入必须要一致的问题.

SPP层原理如下所所示,假定CNN层得到的特征图大小为 a×a a × a (比如 13×13 13 × 13 ,随输入图片大小而变化),设定的金字塔尺度为

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值