统计学—标准化和归一化的区别

最新推荐文章于 2023-04-14 09:54:03 发布

known_5978

最新推荐文章于 2023-04-14 09:54:03 发布

阅读量3.3k

点赞数 1

文章标签：数据分析

本文链接：https://blog.csdn.net/weixin_44189446/article/details/108352601

版权

数据的标准化（normalization）是将数据按比例缩放，使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到，去除数据的单位限制，将其转化为无量纲的纯数值，便于不同单位或量级的指标能够进行比较和加权

归一化
将数据统一映射到[0,1]的范围内，消除不同数据之间的尺度和单位影响。

公式：
$x^* = \frac{x-x_{min}} {x_{max}-x_{min}}$
标准化(z-score)
处理的数据符合标准正态分布，即均值为0，标准差为1。不限制数据范围
公式：
$x^* = \frac{x-μ} {σ}$
其中μ为所有样本数据的均值，σ为所有样本数据的标准差。

标准化：
不改变原始数据的分布。
对不同特征维度的伸缩变换的目的是使得不同度量之间的特征具有可比性。

 1. 优点：
 	- 使得不同度量之间的特征具有可比性，对目标函数的影响体现在几何分布上，而不是数值上。
 	- 不改变原始数据的分布
 2. 缺点：
 	原始数据的分布可以近似为高斯分布（正态分布），否则效果会变得很糟糕

适用：在机器学习中有不同，后续学习了再来补充文章内容

关注