[1] Norm matters: efficient and accurate normalization schemes in deep networks
Elad Hoffer , Ron Banner , Itay Golan, Daniel Soudry
Technion - Israel Institute of Technology, Intel - Artificial Intelligence Products Group (AIPG)
https://papers.nips.cc/paper/7485-norm-matters-efficient-and-accurate-normalization-schemes-in-deep-networks.pdf
过去几年,批归一化广泛应用于深层网络中,这种技巧可以加速训练过程,并且在多种应用中可以提升效果。但是这种技巧之所以带来好的效果的原因尚待探索,并且有一些缺陷阻碍了该技巧在某些任务中的应用。
这篇文章给出了归一化方法和权重衰减方法的目的及作用层面的新视角,将其视为优化目标中减弱权重范数的工具。这种特性可以凸显归一化,权重衰减以及学习率调整之间的联系。
针对广泛应用的二范数的批归一化方法,这篇文章给出了几种替代方法,比如一范数的归一化,无穷范数的归一化,如此操作不仅可以降低计算复杂度和存储需求,而且可以显著提升数值稳定性,尽管准确率会低一些。
不同归一化方法的效果对比如下