spatial pyramid pooling（空间金字塔池化理解）

最新推荐文章于 2024-03-13 12:06:41 发布

jwspl

最新推荐文章于 2024-03-13 12:06:41 发布

阅读量1k

点赞数

分类专栏： # 深度学习文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43881803/article/details/106350160

版权

空间金字塔池化由何凯明在2014年的论文中提出，用于缓解卷积网络与全连接层的输入尺寸问题。通过不同尺度的划分，将任意大小的特征图转换为固定尺寸的特征向量，实现多尺度特征提取。该方法允许网络接受不同大小的输入，并在连接全连接层前保持尺寸一致性。

摘要由CSDN通过智能技术生成

起源

何凯明2014年的paper：《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》，这篇paper主要的创新点在于提出了空间金字塔池化。paper主页

目的

缓解卷积或池化与全连接层的大小差异，因为卷积与池化无论大小都是一样做的，全连接却要求输入大小，因为有固定的权重矩阵。

原理

空间金字塔是很久以前的一种特征提取方法，跟Sift、Hog等特征息息相关。为了简单起见，我们假设一个很简单两层网络：

输入层：一张任意大小的图片,假设其大小为(w,h)。

输出层：21个神经元。

也就是我们输入一张任意大小的特征图的时候，我们希望提取出21个特征。空间金字塔特征提取的过程如下：
在这里插入图片描述
如上图所示，当我们输入一张图片的时候，我们利用不同大小的刻度，对一张图片进行了划分。上面示意图中，利用了三种不同大小的刻度，对一张输入的图片进行了划分，最后总共可以得到16+4+1=21个块，我们即将从这21个块中，每个块提取出一个特征，这样刚好就是我们要提取的21维特征向量。

第一张图片,我们

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
spatial pyramid pooling（空间金字塔池化理解）

起源何凯明2014年的paper：《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》，这篇paper主要的创新点在于提出了空间金字塔池化。paper主页目的缓解卷积或池化与全连接层的大小差异，因为卷积与池化无论大小都是一样做的，全连接却要求输入大小，因为有固定的权重矩阵。原理空间金字塔是很久以前的一种特征提取方法，跟Sift、Hog等特征息息相关。为了简单起见，我们假设一个很简单两层网络：
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。