2.1.3 正则化（归一化）的用处以及何时使用

最新推荐文章于 2023-04-23 22:31:24 发布

Einstellung

最新推荐文章于 2023-04-23 22:31:24 发布

阅读量2.5k

点赞数 2

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/einstellung/article/details/80031464

版权

深度学习专栏收录该内容

43 篇文章 3 订阅

订阅专栏

正则化输入

假设我有一个训练集，它有两个输入特征x1和x2,。归一化输入需要两个步骤。第一步是零均值话（subtract mean），经过零均值话处理之后数据就如中间那个图分布的那样。

这里写图片描述

第二步是归一化方差，我们注意到x1的方差要比x2的方差大很多。所以进行如下操作：

σ 2 = 1 m \sum i = 1 m x 2 (1)

$\sigma^2 = \frac{1}{m}\sum_{i=1}^m{x^2} \tag{1}$

x = x σ 2 (2)

$x = \frac{x}{\sigma^2} \tag{2}$
之后图片就变成右边的样子了。

注意，我们这里实际上是x-0的平方，因为我们已经做了零均值处理了，所以我们的均值就是0，m是样本量，这样我们就计算出了方差。我们通常情况下归一化是使用

x - μ σ 2

$\frac{x-\mu}{\sigma^2}$
但是这里的均值是0，所以(2)就这样实现了归一化处理。

最后右图x1和x2的方差都变成了0。我们这里要提醒一下如果你用相同的归一化方式去处理了训练集，那么一定要用相同的方式去处理测试集

我们为什么要进行正则化输入呢

如果你使用了非归一化进行处理，最后cost函数就会像左图这样非常细长而狭窄。因为x1的取值范围可能是0到1000，而x2的取值范围可能只是0到1。结果会使得w1和w2的值范围变得非常不同。最后cost function就会像这样变得非常细长。

这里写图片描述

而你使用归一化处理后函数可能会变得比较均匀，就像右图所示。如果在左图使用梯度下降法运行，那么你必须使用一个非常小的学习率，那将会增加许多迭代次数。但如果函数是一个圆的球形轮廓，那么不论从哪个位置开始，梯度下降法都能更直接的找到最小值。可以在梯度下降法中使用较大步长。

因此，如果输入特征属于不同范围，那么归一化是十分重要的，但是如果特征值在比较近似的范围内，那么归一化就不那么重要了

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
2
评论
2.1.3 正则化（归一化）的用处以及何时使用

正则化输入假设我有一个训练集，它有两个输入特征x1和x2,。归一化输入需要两个步骤。第一步是零均值话（subtract mean），经过零均值话处理之后数据就如中间那个图分布的那样。第二步是归一化方差，我们注意到x1的方差要比x2的方差大很多。所以进行如下操作：σ2=1m∑i=1mx2(1)(1)σ2=1m∑i=1mx2\sigma^2 = \frac{1}{m}\sum_{i=...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Einstellung 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。