1.概念
池化是将高维特征映射概括为低维特征映射的操作。由于卷积运算的重叠性,很多计算的特征是冗余的,而池化就可以将较大且特征较弱的图转化为较小且特征较强的图。
2.运算规则
池化和卷积都需要过滤器,但是不同的是池化的过滤器仅仅只是区域,并没有具体的数值,因此根据区域内不同的运算可以分为最大池化、平均池化、求和池化等。
(1)最大池化(最大池)
即对过滤器覆盖的区域取最大值作为这片区域的提取的特征。假设输入的图片是4*4的灰度图片(二维,只有一个通道),过滤器选择2*2,步长选择2,这样的效果就是将4*4的图片分为4块,因此结果是2*2的图像。如下图所示:
左上角区域最大值是9,右上角最大值是2,左下角最大值是6,右下角最大值是3。最大池化的直观理解就是区域内最大值可能就是我们想要提取的重要特征,比如边缘检测,通常边缘附近是数值变化较大的地方,比如由亮变暗,像素值由大变小,如果过滤器覆盖了边缘,就会找到像素值大的特征值提取出来,从而保留重要的边缘信息,减少不是边缘的冗余信息。
如下是选择过滤器大小f为3*3、步长s=1、输入图片是5*5的最大值池化另一个例子:
如果输入的图片是彩色RGB图片,有3通道,那么输出也是3通道的,即对每一个通道都做相同的池化运算。这就是最大值池化。
(2)平均值池化(平均池)
即对过滤器覆盖的区域取平均值,平均池化用到没有最大值池化多,但是在深度很深的网络可能会使用到。如下是输入为4*4、过滤器大小f为2(2*2)、步长s=2的平均值池化:
(3)求和池化(和池)
即对过滤器所覆盖的局部区域进行求和,实际中使用没有前两种多,也没有重要的细节,这里不再介绍。
3.特点
池化层有超参数过滤器大小f、步长s和池化种类(最大池、平均池等等),但是很少使用padding填充,因为我们的目的就是减少冗余,进行填充后反而引入冗余。输出图片的维度同卷积,不了解的见文章深度学习基础—卷积运算:
深度学习基础—卷积运算http://t.csdnimg.cn/yZrfF
总结来看,池化有以下特点:
(1)不需要学习超参数,比如过滤器的大小f和步长s,实际上只要设置好这些超参数的值,网络就会一直按照这些值向前传播,梯度下降时不再改变。
(2)缩减模型大小,提高运算速度,提高所提取特征的鲁棒性。
(3)输入的通道和输出的通道数相同,因为对每一个通道都做了池化。