1. 简介
批标准化本质上就对每层激活函数之前的数据进行标准化
2. 批标准化的作用
- 批标准化能够解决梯度消失和梯度爆炸的问题
- 批标准化能够提高模型的泛化能力,解决过拟合问题
- 批标准化具有正则化的作用
- 批标准化能够允许更高的学习速率 从而加块模型收敛
- 批标准化允许更深的网络,对于特别深的网络,只有包含多个BtachNormalization层才能进行训练
3. 批标准化的实现过程
- 求每个训练批次的均值
- 求每个训练批次的方差
- 进行数据标准化
- 训练参数β和γ
想要进一步了解Batch Normalization和Layer Normalization的区别 请参考这篇文章#深入理解# Batch Normalization Layer Normalization