Batch normalization和Layer normalization有什么区别？

最新推荐文章于 2024-05-10 09:44:27 发布

AI有温度

最新推荐文章于 2024-05-10 09:44:27 发布

阅读量7.9k

点赞数 2

文章标签： batch 机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Antai_ZHU/article/details/121272709

版权

原文链接：Batch/Layer normalization有什么区别？

大家好，我是泰哥。在训练模型前，我们通常要对数据进行归一化处理来加速模型收敛。本文为大家介绍batch normalization和layer normalization的使用场景。

1 为什么`ML`中用`BN`比较多？

现在有一个batch内的人员特征数据，分别是年龄、身高和体重，我们需要根据这3个特征进行性别预测，在预测之前首先要进行归一化处理。

`ML & batch normalization`

BN是针对每一列特征进行归一化，例如下图中计算的均值：

BN这是一种“列归一化”，同一batch内的数据的同一纬度做归一化，因此有3个维度就有3个均值。

`ML & layer normalization`

而LN则相反，它是针对数据的每一行进行归一化。即只看一条数据，算出这条数据所有特征的均值，例如下图：

LN是一种“行归一化”,是对单个样本的所有维度来做归一化。

Why `ML&BN`?

这里大家就可以看出，LN计算出一个人的年龄、身高、体重这三个特征的均值并对其归一化，完全没有道理和可解释性，但是BN则没有这个影响，因为每列的单位属性都是相同的。

在机器学习任务中，数据往往是每列数据为一特征，处理的数据通常具有解释性，而列与列之间的单位属性并不相同，所以机器学习任务中用BN比较多。

2 为什么`NLP`中用`LN`比较多？

在这里插入图片描述

上图是4条文本数据组成了一个batch，我们假设每个字的embedding都为1。

`NLP & batch normalization`

那么BN是针对每一列特征进行归一化，就会把4条文本相同位置的字来做归一化处理，例如：天、公、要、影。

在这里插入图片描述

而这样做的话就破坏了一个字在原句中的原有含义。

`NLP & layer normalization`

而LN则是针对每一句话做归一化处理。
在这里插入图片描述

在归一化后使一句话中的embedding处于同分布。

3 根本原因

在ML中输入的数据一般是矩阵，每列数据都具有相同属性，所以使用BN较多。

在NLP中，因为数据维度一般都是[batch_size, seq_len, dim_size]，我们最终希望将一句话中的词向量进行归一化，所以使用LN较多。

4 总结

从操作过程上来讲，BN针对的是同一个batch内的所有数据，而LN则是针对单个样本。

从特征维度来说，BN对同一batch内的数据的同一纬度做归一化，因此有多少维度就有多少个均值和方差；而LN则是对单个样本的所有维度来做归一化，因此一个batch中就有batch_size个均值和方差。

更多AI干货尽在公众号【AI有温度】
在这里插入图片描述

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
Batch normalization和Layer normalization有什么区别？

AI因你而升温，记得加个星标哦！大家好，我是泰哥。在训练模型前，我们通常要对数据进行归一化处理来加速模型收敛。本文为大家介绍batch normalization和layer normalization的使用场景。1 为什么ML中用BN比较多？现在有一个batch内的人员特征数据，分别是年龄、身高和体重，我们需要根据这3个特征进行性别预测，在预测之前首先要进行归一化处理。ML & batch normalizationBN是针对每一列特征进行归一化，例如下图中计算的均值：BN这是.
复制链接

扫一扫

AI有温度 CSDN认证博客专家 CSDN认证企业博客

码龄5年

26: 原创

17万+: 周排名

199万+: 总排名

18万+: 访问

: 等级

902: 积分

587: 粉丝

475: 获赞

33: 评论

4253: 收藏

私信

关注

热门文章

最新评论

大模型是这样炼成的
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
人工智能该如何学习？详细的AI学习路线与资料推荐
qq_35765165: 菜菜的sklearn没了
NLP标注神器：可同时对文本与实体进行标注
weixin_41788727: 制作上传的数据json时json.dumps(res, ensure_ascii=True, indent=4)中ensure_ascii设置为True，上传到工具中就显示中文了，，
人工智能该如何学习？详细的AI学习路线与资料推荐
sad209: 简直是义父呀！
人工智能该如何学习？详细的AI学习路线与资料推荐
妄与秋水换色wang: 我在搞图像分割方面的研究，前期就是学一些深度学习机器学习的内容，后来找一个感兴趣的方向，但是注意注意大学一定好好学专业课，这个只是课外扩展，想继续深造就读论文，复现论文研究的东西，后面就看自己的进展了，我反正很菜

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。