一-训练阶段
通过计算可以发现,BatchNorm是对一个mini-batch的所有样本的每个特征通道为整体计算均值和方差,以此来归一化每个特征通道。并不是采用所有特征通道一起的均值和方差进行归一化。
在训练阶段采用移动平均的均值和方差是为了得到训练集整体的均值和方差,因为每次数据输入都是一个batch,不是一整个数据集,所以采用指数加权的方式得到整体的均值和方差,以供测试时使用。
二、测试阶段
一-训练阶段
通过计算可以发现,BatchNorm是对一个mini-batch的所有样本的每个特征通道为整体计算均值和方差,以此来归一化每个特征通道。并不是采用所有特征通道一起的均值和方差进行归一化。
在训练阶段采用移动平均的均值和方差是为了得到训练集整体的均值和方差,因为每次数据输入都是一个batch,不是一整个数据集,所以采用指数加权的方式得到整体的均值和方差,以供测试时使用。
二、测试阶段