pooling层是如何作用在反向传播的过程中?曾经面试被问过这个问题,当时的回答是pooling不参与反向传播,但是也没深究是怎么个不参与法。本文进行简析。
pooling通常分两种:max和mean。由于pooling层会改变feature的尺寸,因此有如下假设成立:
假设经过pooling后有n个梯度,那么pooling层的前一层梯度个数为4n,使得反向传播时梯度无法一一对应地传下去。
那么在神经网络中,解决上述问题的方法很简单,根据网络传递时总的loss/梯度不变的原则。以2*2 pooling操作举例,反向传播的过程就是将I+1层的一个像素点的梯度传给I层的4个像素点即可。那么按照pooling的不同进行阐述:
①max-pooling
记录前向传播时第I层中2*2像素内的最值点的索引,反向传播时将I+1层的梯度传给I层中的max索引位置,其余三个位置置0。
②mean-pooling
将I+1层的梯度分成四等份传给第I层
博文参考:https://blog.csdn.net/qq_21190081/article/details/72871704