Batch Norm

最新推荐文章于 2024-07-22 10:24:10 发布

sam-X

最新推荐文章于 2024-07-22 10:24:10 发布

阅读量558

点赞数

分类专栏：深度学习文章标签：深度学习 batch norm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010945683/article/details/78044755

版权

深度学习专栏收录该内容

14 篇文章 0 订阅

订阅专栏

Batch Norm

source from: Deep Learning Specialization

效果

normalize inputs to speed up learning
mean/variance computed on just that mini-batch similar to dropout, it adds some noise to each hidden layer’s activations. Thus, this has a slight regularization effect

过程

块正则化过程：

B e f o r e : z (1) 、 z (2) 、 . . . 、 z (m) μ = 1 m \sum i z (i) σ 2 = 1 m \sum i (z (i) - μ) 2 A f t e r : z (i) n o r m = z ( i ) - μ σ 2 + ϵ - - - - - \sqrt (ϵ 是 为 了 保 证 数 值 稳 定 性) z^(i) = α z (i) n o r m + β

$Before:z^{(1)}、z^{(2)}、...、z^{(m)}\\ \mu={1\over m}\sum_iz^{(i)}\\ \sigma^2={1\over m}\sum_i{(z^{(i)}-\mu)}^2\\ After:z_{norm}^{(i)}={{z^{(i)}-\mu}\over {\sqrt{\sigma^2+\epsilon}}}\\ (\epsilon是为了保证数值稳定性)\\ \hat z^{(i)}=\alpha z_{norm}^{(i)}+\beta$

α $\alpha$ 和

β $\beta$ 作为学习参数

由此原先

z [l] = w [l] a [l - 1] + b [l]

$z^{[l]}=w^{[l]}a^{[l-1]}+b^{[l]}$
中的

b[l] $b^{[l]}$ 没有了任何作用

测试中的Batch Norm

由于测试中只能使用一个样本，因此Batch Norm中的mean/variance不再有实际意义。
测试中使用的mean/variance是训练中多个mini-batch的指数加权平均。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。