BatchNorm和LayerNorm的对比

Kadima08

已于 2023-02-22 22:53:54 修改

阅读量183

点赞数 1

分类专栏： MyML 文章标签： python 机器学习开发语言

于 2023-02-22 22:49:20 首次发布

原文链接：https://blog.csdn.net/Little_White_9/article/details/123345062

版权

MyML 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

BatchNorm的理解

在这里插入图片描述
BatchNorm把一个batch中同一通道的所有特征（如上图红色区域）视为一个分布（有几个通道就有几个分布），并将其标准化。这意味着:

不同图片的的同一通道的相对关系是保留的，即不同图片的同一通达的特征是可以比较的
同一图片的不同通道的特征则是失去了可比性

有一些可解释性方面的观点认为，feature的每个通道都对应一种特征（如低维特征的颜色，纹理，亮度等，高维特征的人眼，鸟嘴特征等）。BatchNorm后不同图片的同一通道的特征是可比较的，或者说A图片的纹理特征和B图片的纹理特征是可比较的；而同一图片的不同特征则是失去了可比性，或者说A图片的纹理特征和亮度特征不可比较。
这其实是很好理解的，视觉的特征是比较客观的，一张图片是否有人跟一张图片是否有狗这两种特征是独立，即同一图片的不同特征是不需要可比性；而人这种特征模式的定义其实是网络通过比较很多有人的图片，没人的图片得出的，因此不同图片的同一特征需要具有可比性。

LayerNorm的理解

在这里插入图片描述
如上图LayerNorm把一个样本的所有词义向量（如上图红色部分）视为一个分布（有几个句子就有几个分布），并将其标准化。这意味着:

同一句子中词义向量（上图中的V1, V2, …, VL）的相对大小是保留的，或者也可以说LayerNorm不改变词义向量的方向，只改变它的模。
不同句子的词义向量（样本）则是失去了可比性。

考虑两个句子，“教练，我想打篮球！” 和 “老板，我要一打包子。”。通过比较两个句子中 “打” 的词义我们可以发现，词义并非客观存在的，而是由上下文的语义决定的。
因此进行标准化时不应该破坏同一句子中不同词义向量的可比性，而LayerNorm是满足这一点的，BatchNorm则是不满足这一点的。且不同句子的词义特征也不应具有可比性，LayerNorm也是能够把不同句子间的可比性消除。

总结

BatchNorm适用于CV，而LayerNorm适用于NLP，这是由两个任务的本质差异决定的，视觉的特征是客观存在的特征，而语义特征更多是由上下文语义决定的一种统计特征，因此他们的标准化方法也会有所不同。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
BatchNorm和LayerNorm的对比

BatchNorm适用于CV，而LayerNorm适用于NLP，这是由两个任务的本质差异决定的，视觉的特征是客观存在的特征，而语义特征更多是由上下文语义决定的一种统计特征，因此他们的标准化方法也会有所不同。
复制链接

扫一扫

专栏目录

Kadima08 CSDN认证博客专家 CSDN认证企业博客

码龄4年

7: 原创

27万+: 周排名

29万+: 总排名

1万+: 访问

: 等级

102: 积分

5: 粉丝

17: 获赞

1: 评论

63: 收藏

私信

关注

热门文章

分类专栏

MyML 5篇

最新评论

Pycharm导出python环境迁移：Conda/pip环境
CSDN-Ada助手: 恭喜您写了第8篇博客！标题“Pycharm导出python环境迁移：Conda/pip环境”听起来非常有趣。您的博客内容一定对那些正在寻找关于Pycharm环境迁移的解决方案的读者非常有帮助。我希望您可以继续坚持创作，分享更多有关Python环境和工具的实用技巧。下一步，也许您可以考虑介绍一些关于Pycharm中其他有用功能的文章，或者分享您自己的编码经验和技巧。期待您未来的创作！
GCN, GAT, GraphSAGE对比【整理】
SunForee: 原文“比如原始的 GCN 是 inductive 而不是 transductive 的”中的直推和归纳顺序笔误了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。