归一化：Layer Normalization、Batch Normalization

u013250861

已于 2023-10-27 23:35:21 修改

阅读量759

点赞数 1

分类专栏： # 深度学习/DL 机器学习/ML NLP/自然语言处理文章标签： batch 深度学习机器学习

于 2022-02-22 22:15:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013250861/article/details/123073361

版权

机器学习/ML 同时被 3 个专栏收录

38 篇文章 26 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

深度学习/DL

37 篇文章 8 订阅

订阅专栏

NLP/自然语言处理

32 篇文章 8 订阅

订阅专栏

归一化技术在深度学习中用于加速模型收敛，包括Batch Normalization（BN）和Layer Normalization（LN）。BN通过在批次维度上标准化，适合静态网络，但对小批量和RNN效果不佳。相反，LN在同一层内对不同神经元进行归一化，适用于RNN和小批量，提供模型稳定性和正则化效果。

摘要由CSDN通过智能技术生成

Normalization 有很多种，但是它们都有一个共同的目的，那就是把输入转化成均值为 0 方差为 1 的数据。我们在把数据送入激活函数之前进行 normalization（归一化），因为我们不希望输入数据落在激活函数的饱和区。同时，使得训练数据在训练过程中尽可能的保持和测试数据拥有相同的分布。

一方面，这样可以减少数据的偏差，避免在训练过程中出现梯度爆炸或是梯度消失的问题；
另一方面，这也是确保模型测试性能的重要假设之一。

二者提出的目的都是为了加快模型收敛，减少训练时间。
在这里插入图片描述

LN：Layer Normalization，LN是“横”着来的，对一个样本，不同的神经元neuron间做归一化。
BN：Batch Normalization，BN是“竖”着来的，各个维度做归一化，所以与batch size有关系。

一、Batch Normalization（BN）

了解本专栏

超级会员免费看

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。