BatchNorm(BN)层一般置于卷积层之后,在推理时可以和卷积层合并,很多加速组件在计算图优化过程中都会进行这一步操作,这里主要科普下这一合并操作的原理。
卷积层参数包括权重和偏置
,其计算过程为:
(1)
BN层参数包括均值,方差
,缩放因子
,偏置
,以及一个较小的数
(防止分布为0),其计算过程为:
(2)
将公式(1)代入公式(2),即,可得:
(3)
于是,合并后仅为一个卷积操作,其权值为,偏置为
。