BN(批归一化)层常用于在卷积层之后,对feature maps进行归一化,从而加速网络学习,也具有一定的正则化效果。训练时,BN需要学习一个minibatch数据的均值、方差,然后利用这些信息进行归一化,而在推理过程,通常为了加速,都会把BN融入到其上层卷积中,这样就将两步运算变成了一步,也就达到了加速目的。
1、卷积层和BN层
为了搞清楚如何融合卷积和BN,需要先搞懂卷积和BN的过程。
对于卷积层:
我们假设一个卷积核的权重为,卷积过程就是利用在其输入feature map中滑窗计算;假设中一个元素为,输入的feature map中的一个元素为,对于和的计算过程如下:
对于BN层:
需要计算一个minibatch中元素的均值方差,然后对于需要减去均值除以标准差,最后利用γ,β进行仿射变换,即可得到最终的BN输出,具体过程如下:
其中,第一个公式为求均值、第二个公式为求方差、第三个公式为归一化、第四个公式为仿射变换。
2、卷积层和BN层的融合
我们将卷积公式代入到BN的公式中,有:
令:
,
则有:
到这里,就完成了卷积层和BN层的融合。