神经网络训练的一些建议（Batch Normalization）

最新推荐文章于 2024-06-17 15:45:13 发布

Ding_xiaofei

最新推荐文章于 2024-06-17 15:45:13 发布

阅读量2.5k

点赞数 1

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Ding_xiaofei/article/details/81488414

版权

数据的归一化

先放上宏毅大神的图，说明一下我们为什么要做数据的归一化

说明：x2的变化比较大，使用w2方向上就显得比较陡峭（梯度），学习率就不能设置得过大。

Batch Normalization

为什么要有batch normalization

主要是避免internal covariate shift，如图所示，输出上下波动太大（如同第二个人）的话会影响整个模型的训练，第二个人告诉第二个人话筒放低点，第三个人告诉第二个人放高点，如果你的步长过大的话就会变成第二个图，跟没训练一样，所以最开始为了解决这样的状况，会考虑把学习率放小点，但这样网络就会变得比较慢。所以bn就可以把每一层的输出的变化都变小。训练也会变快，我们也就能训练更加深层的神经网络。

这边吴恩达的解释也是异曲同工：
Batch归一化减少了输入值改变的问题，它的确使这些值变得更稳定，神经网络的之后层就会有更坚实的基础。即使使输入分布改变了一些

最低0.47元/天解锁文章

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
神经网络训练的一些建议（Batch Normalization）

数据的归一化先放上宏毅大神的图，说明一下我们为什么要做数据的归一化说明：x2的变化比较大，使用w2方向上就显得比较陡峭（梯度），学习率就不能设置得过大。Batch Normalization为什么要有batch normalization 主要是避免internal covariate shift，如图所示，输出上下波动太大（如同第二个人）的话会影响整个模型的训练...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。