[机器学习与深度学习] - No.4 Normalization和Standardization的区别

最新推荐文章于 2023-05-19 15:46:13 发布

ObsessionLife

最新推荐文章于 2023-05-19 15:46:13 发布

阅读量682

点赞数

分类专栏：机器学习与深度学习文章标签：归一化和标准化机器学习

本文链接：https://blog.csdn.net/tjuyanming/article/details/90041546

版权

机器学习与深度学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

Normalization和Standardization的区别

写在前面：Normalization和Standardization在很多时候，很多文章中并不区分，甚至会使用scaling来代替上述两个词。在这里我们针对两种方法，做一些细微的区分。

Normalization：

将我们的数据值的范围限定在[0,1]之间，也就是我们将常说的归一化。在机器学习的算法中，我们经常会遇到这种情况：

x1	x2
1985	1
1874	3
1600	5

某一列数据的值域和另外一列数据值域相差过大，如果我们只用此类的原始数据，在一些机器学习的优化算法，例如梯度下降中，梯度下降的方向如下所示：

在这里插入图片描述

没有归一化的数据其代价函数看起来像是扁平的碗，同时其梯度下降的方向像是再走“之字形”，迭代很慢。

使用归一化之后的数据，代价函数会看起来很对称，同时训练速度更快，模型精度更高。

常用的归一化方法如下：

最大最小值归一化(线性)：

$\frac{x - x_{min}}{x_{max}-x_{min}}$
对数归一化（非线性）：
$\frac{log_{10}{(x)}}{log_{10}{(x_{max})}}$

Standardization:

将数据进行正态化，使处理后的数据符合标准正态分布，即均值为0，标准差为1。也就是我们常说的标准化。
$\frac{x-\mu}{\delta}$
其中 ${\mu}$ 是指数据的均值， $\delta$ 是指数据的标准差。上述公式又被称为Zero-Mean Normalization 。

总结：

标准化用于调整数据为标准正态分布，归一化用于将数据值域调整为[0,1]。
归一化受最大值，最小值影响；标准化受均值，标准差影响。

ObsessionLife

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
[机器学习与深度学习] - No.4 Normalization和Standardization的区别

Normalization和Standardization的区别写在前面：Normalization和Standardization在很多时候，很多文章中并不区分，甚至会使用scaling来代替上述两个词。在这里我们针对两种方法，做一些细微的区分。Normalization：将我们的数据值的范围限定在[0,1]之间，也就是我们将常说的归一化。在机器学习的算法中，我们经常会遇到这种情况：...
复制链接

扫一扫

专栏目录