批标准化(Batch Norm)

最新推荐文章于 2023-12-31 01:37:34 发布

weixin_33806914

最新推荐文章于 2023-12-31 01:37:34 发布

阅读量194

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/guoyaohua/p/8215710.html

版权

BN作用：

加速收敛
控制过拟合，可以少用或不用Dropout和正则
降低网络对初始化权重不敏感
允许使用较大的学习率

一、如何加速收敛？

通过归一化输入值/隐藏单元值，以获得类似的范围值，可加速学习。
限制了在前层的参数更新会影响数值分布的程度，使层的输出更加稳定，神经网络的之后的层就会有更坚实的基础（减弱了后层的参数因前层参数发生变化而受到的影响） 减弱了前层参数的作用与后层参数的作用之间的联系，使得网络每层都可以自己学习，稍稍独立于其他层，有助于加速整个网络的学习。

二、为什么说BN也会起到一定的正则化作用？

对于Dropout来讲，给每个隐藏单元一定概率置零的可能，这样就相当于给网络引入了噪声。迫使Dropout后部单元不过分依赖于前面任何一个隐藏单元。

而BN，因为是在Mini-batch上计算mean、variance，而不是整个数据集上。均值和方差有一些小噪音，在进行缩放过程，γ、β也会引入噪声，这样和dropout类似，它往每个隐藏层的激活值上增加了噪音，所以起到了一定的正则化作用。

当mini-batch变大时，由于均值方差更加接近真实值，所以噪声会减小，就会减少正则化的效果。

三、使用BN为何可以不使用参数b?

\[ Z=WX+b \]
无论b为何值，去均值之后结果都是一样的，所以说，使用Batch Norm时可以不使用偏置b。
这个偏置的效果在标准化中缩放过程中能体现。
\[ \tilde{Z} = \gamma Z+\beta \]

转载于:https://www.cnblogs.com/guoyaohua/p/8215710.html

weixin_33806914

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
批标准化(Batch Norm)

BN作用：加速收敛控制过拟合，可以少用或不用Dropout和正则降低网络对初始化权重不敏感允许使用较大的学习率一、如何加速收敛？通过归一化输入值/隐藏单元值，以获得类似的范围值，可加速学习。限制了在前层的参数更新会影响数值分布的程度，使层的输出更加稳定，神经网络的之后的层就会有更坚实的基础（减弱了后层的参数因前层参数发生变化而受到的影响）减弱了前层参数的作用与后层参数的作用之...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。