跟李沐学AI：批量归一化

最新推荐文章于 2024-09-16 13:46:43 发布

Landy_Jay

最新推荐文章于 2024-09-16 13:46:43 发布

阅读量299

点赞数 3

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Landy_Jay/article/details/141053786

版权

目录

为什么需要批量归一化？

批量归一化核心思想

批量归一化总结

为什么需要批量归一化？

损失出现在较深层次的网络。随着网络深度的增加，梯度在反向传播过程中会逐渐减小，导致靠近输入层的权重更新变得非常缓慢。这是因为梯度通过每一层时都会被相应的激活函数导数所乘，而这些导数可能非常小。因底部层损失较小，故底部曾训练较慢。

同时底部层的权重发生变化，其余层的权重同时发生变化，底部层需要重新学习多次导致收敛变慢。每一层的权重更新不仅取决于自身的梯度，还受到前一层权重更新的影响。如果前一层的权重发生了变化，那么即使当前层的梯度没有变化，当前层的权重也会受到影响。这种现象称为内部协变量移位。

批量归一化核心思想

固定mini-batch小批量中的均值和方差使其服从特定分布使其稳定。将mini-batch在每层的输出的均值和方差固定。

首先固定mini-batch中的均值和方差：

然后再做额外的调整：

μ^B是小批量B的样本均值，σ^B是小批量B的样本标准差。应用标准化后，生成的小批量的平均值为0和单位方差为1。由于单位方差（与其他一些魔法数）是一个主观的选择，因此我们通常包含 拉伸参数（scale）γ和偏移参数（shift）β，它们的形状与x相同。请注意，γ和β是需要与其他模型参数一起学习的参数。γ和β为科学系的参数。

作用在全连接层和卷积层的输出上和激活函数之前。批量归一化是线性变换。也可以作用在全连接层和卷积层的输入上。

对于全连接层，BN作用在特征维度，对全连接层的每一个输出做BN。

对于卷积层，作用在通道维度。

批量归一化在做什么？

论文最初想用其减少内部协变量转移（内部协变量移位是指每一层的输入分布随训练过程改变的现象，这种改变会影响到后续层的学习任务，因为每一层都必须不断适应前一层输出分布的变化。）

后续有论文指出BN是在通过在每个mini-batch中加入噪音（μ^B、σ^B）以控制模型复杂度。因此BN没必要与dropout共同使用。

批量归一化总结

批量归一化固定小批量中的均值和方差，然后学习出合适的偏移和缩放。

BN可以加速收敛但一般不改变模型精度。

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Landy_Jay CSDN认证博客专家 CSDN认证企业博客

码龄2年

52: 原创

4万+: 周排名

2万+: 总排名

2万+: 访问

: 等级

1047: 积分

400: 粉丝

518: 获赞

9: 评论

494: 收藏

私信

关注

热门文章

最新评论

跟李沐学AI：长短期记忆网络LSTM
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
跟李沐学AI：语义分割
ha_lydms: 语义分割，这个内容讲解的很棒
SSM学习：配置整合
CSDN-Ada助手: 恭喜您发布了第14篇博客“SSM学习：配置整合”，内容精彩，让读者受益匪浅！希望您能继续坚持创作，分享更多有价值的知识和经验。在下一篇博客中，或许可以深入探讨一些实际案例或者应用场景，让读者更直观地理解SSM整合的实际应用。期待您的更多精彩分享！
Spring MVC学习：接收数据
CSDN-Ada助手: 恭喜您写了第12篇博客！学习Spring MVC接收数据确实是一个重要的话题，希望您能继续保持写作的热情和努力。接下来，或许可以考虑深入探讨Spring MVC中数据校验、数据绑定等相关内容，这些都是非常有价值的学习方向。期待看到您更多精彩的文章，加油！👏👏👏
Spring MVC学习：响应数据
CSDN-Ada助手: 恭喜你写了第13篇博客！看到你对Spring MVC的学习取得了进展，我感到非常高兴。希望你能继续保持热情，坚持不懈地写下去。接下来，我建议你可以尝试深入探讨Spring MVC中不同响应数据的处理方式，或者分享一些实际项目中的应用经验，这样可以让读者更加深入地了解这个主题。期待看到你更多的优质内容，加油！

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。