【批量归一化】

最新推荐文章于 2024-09-12 21:05:39 发布

菜鸟炼丹师

最新推荐文章于 2024-09-12 21:05:39 发布

阅读量116

点赞数 2

分类专栏： # 沐神动手学ai学习笔记深度学习文章标签：机器学习深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chenjunheaixuexi/article/details/125402092

版权

批量归一化是解决深度神经网络中梯度消失和训练速度问题的有效方法，通过固定小批量数据的均值和方差，增加数值稳定性。它加速了模型收敛，通常应用于全连接层和卷积层的激活函数前，有助于减少内部协变量转移并控制模型复杂度。批量归一化层包含可学习的参数γ和β，用于调整数据分布，但不应与丢弃法同时使用。

摘要由CSDN通过智能技术生成

几乎所有的主流神经网络都会使用批量归一化，虽然这个思想早已出现，但是这个层的出现没多久。同事想要做很深的神经网络时，这更是一个不可避免的层。

现存问题

正向计算时是从底部向后传播，但计算梯度时是反向传播，越往底层越有可能造成梯度消失。
损失出现在最后，后面的层训练较快
数据在最底部
- 底部的层训练较慢
- 底部层一变化，所有都得跟着变
- 最后的那些层需要重新学习多次
- 导致收敛变慢
我们可以在学习底部层的时候避免变
化顶部层吗？

核心思想

之所以后面的参数会随着前面的参数不停变得原因是方差和均值在不同的层之间在不停地变化，我们可以通过固定住分布来增加数值的稳定性

固定小批量里面的均值和方差
$\mu_B=\frac{1}{|B|}\sum\limits_{i\in B}x_i$

最低0.47元/天解锁文章

菜鸟炼丹师

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
【批量归一化】

几乎所有的主流神经网络都会使用批量归一化，虽然这个思想早已出现，但是这个层的出现没多久。同事想要做很深的神经网络时，这更是一个不可避免的层。现存问题核心思想之所以后面的参数会随着前面的参数不停变得原因是方差和均值在不同的层之间在不停地变化，我们可以通过固定住分布来增加数值的稳定性批量归一化层批量归一化在做什么总结...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

菜鸟炼丹师 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。