为了加快神经网络的训练速度,本文引入了层归一化方法。对层归一化与批处理归一化、权值归一化的不变性进行了理论分析。我们证明了层归一化对于每个训练用例的特征移动和缩放是不变的。实验结果表明,该方法对小批量、长序列的递归神经网络最有效。
[arXiv16] Layer Normalization
[arXiv16] Layer Normalization-层归一化
最新推荐文章于 2024-07-20 16:58:57 发布
为了加快神经网络的训练速度,本文引入了层归一化方法。对层归一化与批处理归一化、权值归一化的不变性进行了理论分析。我们证明了层归一化对于每个训练用例的特征移动和缩放是不变的。实验结果表明,该方法对小批量、长序列的递归神经网络最有效。
[arXiv16] Layer Normalization