池化层的作用理解与总结

CtrlZ1

已于 2023-03-18 22:31:44 修改

阅读量7.9k

点赞数 1

分类专栏：机器学习深度学习算法知识文章标签：深度学习池化

于 2020-12-17 20:09:48 首次发布

原文链接：https://blog.csdn.net/weixin_42193719/article/details/103860206

版权

机器学习深度学习算法知识专栏收录该内容

17 篇文章 3 订阅

订阅专栏

原文：池化层的作用总结：_夜游神fff的博客-CSDN博客

池化层的作用总结：

在卷积神经网络中通常会在相邻的卷积层之间加入一个池化层，池化层可以有效的缩小参数矩阵的尺寸，从而减少最后连接层的中的参数数量。所以加入池化层可以加快计算速度和防止过拟合的作用。

池化的原理或者是过程：pooling是在不同的通道上分开执行的（就是池化操作不改变通道数），且不需要参数控制。然后根据窗口大小进行相应的操作。一般有max pooling、average pooling等。

1.池化层主要的作用

（1）首要作用，下采样（downsamping）

（2）降维、去除冗余信息、对特征进行压缩、简化网络复杂度、减小计算量、减小内存消耗等等。各种说辞吧，总的理解就是减少参数量。

（3）实现非线性（这个可以想一下，relu函数，是不是有点类似的感觉？）。

（4）可以扩大感知野。

（5）可以实现不变性，其中不变形性包括，平移不变性、旋转不变性和尺度不变性。（关于不变性的解释，请移步：不变性(invariance)详细解释_invariance scale_CtrlZ1的博客-CSDN博客）

参考链接：
[1] https://zhuanlan.zhihu.com/p/27642620
[2] https://www.zhihu.com/question/36686900
[3] https://blog.csdn.net/LIYUAN123ZHOUHUI/article/details/61920796

2.池化主要有哪几种：

1）一般池化（General Pooling）：
其中最常见的池化操作有平均池化、最大池化：

平均池化（average pooling）：计算图像区域的平均值作为该区域池化后的值。

最大池化（max pooling）：选图像区域的最大值作为该区域池化后的值。

（2）重叠池化（OverlappingPooling）：
重叠池化就是，相邻池化窗口之间有重叠区域，此时一般sizeX > stride。

（3）空金字塔池化（Spatial Pyramid Pooling）
空间金字塔池化的思想源自 Spatial Pyramid Model，它将一个pooling变成了多个scale的pooling。用不同大小池化窗口作用于上层的卷积特征。也就是说 spatital pyramid pooling layer就是把前一卷积层的feature maps的每一个图片上进行了3个卷积操作，并把结果输出给全连接层。其中每一个pool操作可以看成是一个空间金字塔的一层。（具体的细节可以看下面的参考链接，讲的比较详细）

这样做的好处是，空间金字塔池化可以把任意尺度的图像的卷积特征转化成相同维度，这不仅可以让CNN处理任意尺度的图像，还能避免cropping和warping操作，导致一些信息的丢失，具有非常重要的意义。