深度学习——Pooling Layer

最新推荐文章于 2024-07-31 21:33:53 发布

jmucvm

最新推荐文章于 2024-07-31 21:33:53 发布

阅读量1.4k

点赞数

分类专栏：深度学习文章标签： Pooling Layer MaxPooling AveragePooling

本文链接：https://blog.csdn.net/jmu201521121021/article/details/86776174

版权

34 篇文章 3 订阅

订阅专栏

Pooling Layer正常是用于Convolution Layer后面，可以进一步提取有效特征，降低 $n_W,n_H$ 维度，减少计算量。Pooling 层和Convolution层一样具有 $s t r i d e (d) 、 f 、 p a d (p)$ 参数。
Pooling Layer主要有两种：1)Max Pooling、2)Average Pooling,如下图（1）
$n_H^l=\lfloor \frac{n_H^{l-1}+2*p-f}{s}+1\rfloor,n_W^l=\lfloor \frac{n_W^{l-1}+2*p-f}{s}+1\rfloor,n_C^{l}=n_C^{l-1} \qquad(1)$

$f i g u r e (1)$

Max Pooling如上图(1)所示，对输入数据每一通道在f*f 的slice范围内的数取最大值形成新的矩阵，最后每一通的矩阵concat在一起,维度变为公式（1）。 $f = 2, s t r i d e = 2$ 。
$a_{(nh,nw,c)}^l=max(a^{l-1}_{(nh*stride:nh*stride+f,nw*stride:nw*stride+f,c)})\qquad(2)$

由前向传播可以知道，梯度只要最大值才有，只有最大值才需更新。
$(a^{l-1}_{(nh*stride:nh*stride+f,nw*stride:nw*stride+f,c)}==max)//等于最大值的位置变为1，其他为0 \qquad(3)$
$dA^{l-1}_{(nh*stride:nh*stride+f,nw*stride:nw*stride+f,c)} +=mask*dA^l_{(nw,nh,nc)}(4)$

Average Pooling如上图(1)所示，对输入数据每一通道在f*f 的slice范围内的数计算平均值形成新的矩阵，最后每一通的矩阵concat在一起,维度变为公式（1）。 $f = 2, s t r i d e = 2$ 。
$a_{(nh,nw,c)}^l=\frac{np.sum(a^{l-1}_{(nh*stride:nh*stride+f,nw*stride:nw*stride+f,c)})}{f*f}\qquad(5)$

由前向传播可以知道
$dAverage^{l}_{(nh*stride:nh*stride+f,nw*stride:nw*stride+f,c)}=\frac{np.sum(dAverage^{l-1}_{(nh*stride:nh*stride+f,nw*stride:nw*stride+f,c)})}{f*f}$
$dA^{l-1}_{((nh*stride:nh*stride+f,nw*stride:nw*stride+f,c)} += dAverage^{l}_{(nh*stride:nh*stride+f,nw*stride:nw*stride+f,c)} (4)$