2020-6-10 吴恩达-改善深层NN-w3 Batch归一化(3.4 归一化(正则化)网络的激活函数--batch归一化介绍，通过参数γ和β标准化隐藏层单元z值)

最新推荐文章于 2023-08-17 15:11:01 发布

没人不认识我

最新推荐文章于 2023-08-17 15:11:01 发布

阅读量495

点赞数

分类专栏：深度学习 python IT 文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42555985/article/details/106661221

版权

本文介绍了Batch归一化在深度学习中的重要作用，它能加速学习过程，使网络对超参数选择更稳定。通过计算平均值和方差，对隐藏层的激活值进行归一化，从而提高深层神经网络的训练效率。此外，文章还讨论了在激活函数前还是后的归一化选择，以及γ和β参数如何允许调整归一化后的均值和方差。

摘要由CSDN通过智能技术生成

1.视频网站：mooc慕课https://mooc.study.163.com/university/deeplearning_ai#/c
2.详细笔记网站(中文)：http://www.ai-start.com/dl2017/
3.github课件+作业+答案：https://github.com/stormstone/deeplearning.ai

3.4 归一化[正则化]网络的激活函数 Normalizing activations in a network

1. 归一化逻辑回归输入特征
2. batch归一化
3. 总结

在DL兴起后，最重要的一个思想是它的一种算法，叫做Batch归一化，由Sergey loffe和Christian Szegedy两位研究者创造。

Batch归一化会使你的参数搜索问题变得很容易，使NN对超参数的选择更加稳定，超参数的范围会更加庞大，工作效果也很好，也会使你的训练更加容易，甚至是深层网络。让我们来看看Batch归一化是怎么起作用的吧。

1. 归一化逻辑回归输入特征

在这里插入图片描述

如上图，逻辑回归的归一化例子。

在《改善深层NN-w1 深度学习的实用层面(1.9 归一化输入(特征)》已经学习过
当训练一个模型，比如逻辑回归时，归一化输入特征可以加快学习过程。你

计算了平均值， $μ=\frac 1m\sum_{i=1}^mx^{(i)}$
再从训练集中减去平均值，X := x-μ
计算了方差， $σ^2=\frac 1m\sum_{i=1}^m(x^{(i)})^2$
接着根据方差归一化你的数据集，X /=σ**2。

同时，我们已经学习过，如何把学习问题的轮廓，从很长的东西，变成更圆的东西，更易于算法优化（不论从哪个位置开始，梯度下降法都能够更直接地找到最小值，你可以在梯度下降法中使用较大步长）。

2. batch归一化

那么更深的模型呢？
在这里插入图片描述

如上图。输入特征值 $X$ ，第一层激活值 $a^{[1]}$ ，第二层激活值 $a^{[2]}$ 。
如果你想训练参数，比如 $w^{[3]}$ ， $b^{[3]}$ ，那归一化 $a^{[2]}$ 的平均值和方差岂不是很好？以便使 $w^{[3]}$ ， $b^{[3]}$ 的训练更有效率。

在逻辑回归的例子中，我们看到了如何归一化 $x_1$ ， $x_2$

最低0.47元/天解锁文章

没人不认识我

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。