池化

最新推荐文章于 2024-06-21 20:58:26 发布

wang_yonghua

最新推荐文章于 2024-06-21 20:58:26 发布

阅读量976

点赞数

分类专栏： DeepLearning 文章标签：池化

本文链接：https://blog.csdn.net/wang_yonghua/article/details/89041215

版权

DeepLearning 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

（Pooling）

average：对背景保留较好，max:对纹理提取较好。一般用max.

具有平移不变形。

可以理解为取最大激活的地方，在平移之后仍然具有相同的激活。这里的激活为池化结果，是提取信息的过程。

从反向传播多理解下。

Jason只想做个好程序猿 https://blog.csdn.net/danieljianfeng/article/details/42433475
内容包括：
一般池化（General Pooling）
重叠池化（OverlappingPooling）
空金字塔池化（Spatial Pyramid Pooling）

3. 空金字塔池化（Spatial Pyramid Pooling）[3]

空间金字塔池化可以把任何尺度的图像的卷积特征转化成相同维度，这不仅可以让CNN处理任意尺度的图像，还能避免cropping和warping操作，导致一些信息的丢失，具有非常重要的意义。

一般的CNN都需要输入图像的大小是固定的，这是因为全连接层的输入需要固定输入维度，但在卷积操作是没有对图像尺度有限制，所有作者提出了空间金字塔池化，先让图像进行卷积操作，然后转化成维度相同的特征输入到全连接层，这个可以把CNN扩展到任意大小的图像。

空间金字塔池化的思想来自于Spatial Pyramid Model，它一个pooling变成了多个scale的pooling。用不同大小池化窗口作用于卷积特征，我们可以得到1X1,2X2,4X4的池化结果，由于conv5中共有256个过滤器，所以得到1个256维的特征，4个256个特征，以及16个256维的特征，然后把这21个256维特征链接起来输入全连接层，通过这种方式把不同大小的图像转化成相同维度的特征。

对于不同的图像要得到相同大小的pooling结果，就需要根据图像的大小动态的计算池化窗口的大小和步长。假设conv5输出的大小为a*a，需要得到n*n大小的池化结果，可以让窗口大小sizeX为，步长为。下图以conv5输出的大小为13*13为例。

疑问：如果conv5输出的大小为14*14，[pool1*1]的sizeX=stride=14，[pool2*2]的sizeX=stride=7，这些都没有问题，但是，[pool4*4]的sizeX=5，stride=4，最后一列和最后一行特征没有被池化操作计算在内。

SPP其实就是一种多个scale的pooling，可以获取图像中的多尺度信息；在CNN中加入SPP后，可以让CNN处理任意大小的输入，这让模型变得更加的flexible。

[3] Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Su,Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition,LSVRC-2014 contest

以上摘录。

对全局平均池化（GAP）过程的理解
https://blog.csdn.net/u014264373/article/details/80516294
Global Average Pooling全局平均池化的一点理解
https://blog.csdn.net/qq_23304241/article/details/80292859
总结：https://blog.csdn.net/xys430381_1/article/details/85111839

wang_yonghua

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
池化

（Pooling）average：对背景保留较好，max:对纹理提取较好。一般用max.具有平移不变形。可以理解为取最大激活的地方，在平移之后仍然具有相同的激活。这里的激活为池化结果，是提取信息的过程。从反向传播多理解下。Jason只想做个好程序猿https://blog.csdn.net/danieljianfeng/article/details/42433475内...
复制链接

扫一扫

专栏目录