深度学习基础--池化--空间金字塔池化(spatial pyramid pooling,SPP)

最新推荐文章于 2024-04-25 21:01:25 发布

whitenightwu

最新推荐文章于 2024-04-25 21:01:25 发布

阅读量3.1k

点赞数

分类专栏：深度学习基础

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wydbyxr/article/details/84099535

版权

深度学习基础专栏收录该内容

120 篇文章 15 订阅

订阅专栏

空间金字塔池化(spatial pyramid pooling,SPP)

解决的问题

先前方法，输入图片会经过裁切（Crop）或者变形缩放（Warp），这都在一定程度上导致图片信息的丢失和变形，限制了识别精确度。
SPP可以输入任意大小的图片（不需要经过裁剪缩放等操作，去除网络输入是固定大小的限制），输出固定长度的representation（一维特征向量）。
在这里插入图片描述

意义

R-CNN是直接从原始图片中提取特征，它在每张原始图片上提取2000个Region Proposal，然后对每一个候选区域框进行一次卷积计算，差不多要重复2000次。
假设最后一个卷积层的输出大小为a×a，若给定金字塔层有n×n 个bins，进行滑动窗池化，窗口尺寸为win=a/n，步长为str=a/n，使用一个网络完成一个完整epoch的训练，之后切换到另外一个网络。
只是在训练的时候用到多尺寸，测试时直接将SPPNet应用于任意尺寸的图像。
多尺度特征提取出固定大小的特征向量。

具体操作

SPP层作为pooling的代替。是取max的pooling。前一层是主干网络的最后一个卷积层，然后SPP产生固定大小的输出，后一层是第一个FC层。
具体过程，其实就是从这21个图片块中，分别计算每个块的最大值，从而得到一个输出神经元。
最后把一张任意大小的图片转换成了一个固定大小的21维特征。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
深度学习基础--池化--空间金字塔池化(spatial pyramid pooling,SPP)

空间金字塔池化(spatial pyramid pooling,SPP)解决的问题先前方法，输入图片会经过裁切（Crop）或者变形缩放（Warp），这都在一定程度上导致图片信息的丢失和变形，限制了识别精确度。 SPP可以输入任意大小的图片（不需要经过裁剪缩放等操作，去除网络输入是固定大小的限制），输出固定长度的representation（一维特征向量）。意义 R-CNN是直接从...
复制链接

扫一扫

专栏目录

whitenightwu CSDN认证博客专家 CSDN认证企业博客

码龄8年

478: 原创

3万+: 周排名

189万+: 总排名

204万+: 访问

: 等级

1万+: 积分

453: 粉丝

781: 获赞

218: 评论

3287: 收藏

私信

关注

热门文章

分类专栏

最新评论

训练过程--Batchsize（总之一般情况下batchsize能设多大就设多大）
穆清plus: 有答案了吗
训练过程--Batchsize（总之一般情况下batchsize能设多大就设多大）
qq_45915612: 我的理解是在一阶优化器的时候用小的batchsize，二阶优化器的时候用大的batchsize。博主的意思应该是，batchsize小的时候，数据方差大，相对大的batchsize来说噪声大梯度下降的波动大，在一阶优化器中还是可以接受的，甚至这些波动是让网络模型跳出局部最优点的一个闪光点，但是如果使用二阶优化器的话，梯度下降的波动会更剧烈（一顿乱跳，跳出了局部最优点，也跳过了全局最优点），就会比一阶更不稳定，loss可能会直接炸了。当然，这是我很粗浅的理解，不一定对。
训练过程--Batchsize（总之一般情况下batchsize能设多大就设多大）
qq_45915612: 我想到的是不同的batchsize结果数据保存下来，再画图（我的理解是每次训练完一个网络只能设置一个batchsize，所以要等不同的结果出来了才能画在一张图上）
常用度量--MAE(平均绝对误差)和RMSE(均方根误差)
whitenightwu: 都是相对的。一般是与应用的benchmark相比，才有实际意义。
深度学习基础--卷积--加速的卷积运算
好き: 动不动就要加几句英文，而且都是没必要的，你专业术语弄成英文也就算了，你咋不全用英文写呢

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。