神经网络的归一化（Normalization）

最新推荐文章于 2024-08-17 19:33:44 发布

cling-L

最新推荐文章于 2024-08-17 19:33:44 发布

阅读量2w

点赞数 3

分类专栏：神经网络文章标签：神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lingdexixixi/article/details/79691255

版权

神经网络专栏收录该内容

4 篇文章 0 订阅

订阅专栏

    深度学习中的数据分布偏移：深度神经网络涉及到很多层的叠加，而每一层的参数更新会导致上层的输入数据分布发生变化，通过层层叠加，高层的输入分布变化会非常剧烈。虽然神经网络的各层的输入信号分布不同，但最终“指向“的样本标记是不变的，即边缘概率不同而条件概率一致。

    为了降低分布变化的影响，可使用归一化策略Normalization，把数据分布映射到一个确定的区间。
    神经网络中，常用的归一化策略有BN(Batch Normalization)， WN(Weight Normalization)， LN(Layer Normalization)， IN(Instance Normalization).

BN是针对单个神经元进行归一化操作，多用于batch size大的CNN网络。使用batch size数量的样本的均值和方差，近似整体样本的均值和方差，独立地规范每一个输入维度x。也有人说，BN输出的是标准正态分布（不明白，大量样本的分布是正态分布？）。BN使用的这样均值、方差近似，给神经网络引入了噪声，提高了泛化性。BN对batch size和样本的随机要求相对严苛。

WN是对神经网络的权重进行归一化，不直接依赖于输入样本。虽然是对权重w进行限定，但限定的结果还是反应到y=w＊x+b的y中。

LN是对当前神经网络层单个训练样本的所有神经元的输入进行计算，利用统一的均值和方差，对数据进行归一化。但是，对不同类别的特征使用同样的限定，会降低网络性能。

IN是对单个图像进行的归一化操作。常用于风格迁移等。

GN是对通道进行分组，每个组做归一化操作。GN可以看作是LN与IN之间的一种折中方案。把当前层的所有通道都作为一个组的时候，GN结果就是LN。如果把所有通道N分为N个组里，GN结果就是IN。

代码链接：https://github.com/laicl/pytorch-learning/blob/master/cnn-test.py

基于不同的batch size，对不同的操作进行了一个非常简单的对比。

关注

3
点赞
踩
31

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

cling-L CSDN认证博客专家 CSDN认证企业博客

码龄12年

9: 原创

42万+: 周排名

159万+: 总排名

5万+: 访问

: 等级

509: 积分

7: 粉丝

20: 获赞

13: 评论

96: 收藏

私信

关注

热门文章

分类专栏

最新评论

[pytorch] 自定义激活函数swish（三）
qq_42449901: sigmod(x)括号里面不是还有个参数Beta吗？
pytorch及可视化工具visdom的安装(一)
weixin_43969966 回复 Ras al Ghul: 科学上网一会儿，然后就可以
pytorch及可视化工具visdom的安装(一)
Ras al Ghul 回复 weixin_43969966: 请问您解决这个问题了吗？我也遇到了这个卡在download script的问题
pytorch及可视化工具visdom的安装(一)
weixin_43969966: visdom的版本是0.1.8.9 已经没法更新了但还是卡在那里，请问一下有什么好办法吗
[pytorch] 自定义激活函数swish（三）
qq_27278153: 你好，感谢你的分享。请问swish论文中的，swish-1，这个带有参数。而且可能分为channel-shared，channel-wise这两种情况的激活函数怎么实现呀。能否加QQ 571205937指导下，谢谢！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。