一、为什么提出 神经网络层数较多的时候,训练时,每一层的参数会进行更新。并且会导致更新前后输入的分布有很大变化, 进而神经网络训练过程变慢。而BN可以加快神经网络的收敛速度。 二、BN是什么 深度学习过程中,选择一个小批量数据,计算数据的均值和方差,经过这样的处理,使得每个小批量数据的均值和方差保持在一定的范围。 三、BN要怎么做 选择小批量数据B={x1,x2…xm}得到小批量数据的均值和方差对每个样本进行归一化处理。