批标准化（Batch Normalization）

写出高质量的博客

于 2021-01-08 11:17:24 发布

阅读量127

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhangzhikang_zzk/article/details/112346360

版权

参考原文：

https://www.cnblogs.com/guoyaohua/p/8724433.html

https://blog.csdn.net/sinat_33741547/article/details/87158830

本文是对论文《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》的导读。

机器学习领域有个很重要的假设：独立同分布（IID），即假设训练数据和测试数据服从相同的分布，这是通过训练数据获得模型能够在测试集上获得好的效果的一个基本保障。

那BatchNorm的作用是什么呢？BatchNorm就是在深度神经网络训练过程中使得每一层神经网络的输入保持相同分布的。

为什么深度神经网络随着网络深度加深，训练起来越困难，收敛越来越慢？这是个在DL领域很接近本质的好问题。很多论文都是解决这个问题的，比如ReLU激活函数，再比如Residual Network，BN本质上也是解释并从某个不同的角度来解决这个问题的。

BatchNorm为什么NB呢，关键还是效果好。①不仅仅极大提升了训练速度，收敛过程大大加快；②还能增加分类效果，一种解释是这是类似于Dropout的一种防止过拟合的正则化表达方式，所以不用Dropout也能达到相当的效果；③另外调参过程也简单多了，对于初始化要求没那么高，而且可以使用大的学习率等。总而言之，经过这么简单的变换，带来的好处多得很，这也是为何现在BN这么快流行起来的原因。

写出高质量的博客

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
批标准化（Batch Normalization）

参考原文：https://www.cnblogs.com/guoyaohua/p/8724433.htmlhttps://blog.csdn.net/sinat_33741547/article/details/87158830本文是对论文《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》的导读。机器学习领域有个很重要的假设：独立同分布（IID），即假设训
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。