机器学习数据的标准化（normalization）和归一化

最新推荐文章于 2024-01-30 16:37:19 发布

SamWang_333

最新推荐文章于 2024-01-30 16:37:19 发布

阅读量1.1k

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/qq_38844711/article/details/103403583

版权

数据标准化和归一化是机器学习中重要的预处理步骤，用于调整特征的尺度。标准化通常使数据符合标准正态分布，如Z-score方法，而归一化则将数据映射到[0,1]区间。在存在异常值时，RobustScaler是更好的选择。在涉及距离度量或PCA时，Z-score标准化更优，而对于图像处理等场景，归一化至[0,255]可能是合适的。" 119934210,1178458,使用iOSDefender SDK保护你的iOS应用,"['ios', '安全', 'SDK', 'RASP', '应用程序保护']

摘要由CSDN通过智能技术生成

数据的标准化（normalization）和归一化
数据的标准化（normalization）是将数据按比例缩放，使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到，去除数据的单位限制，将其转化为无量纲的纯数值，便于不同单位或量级的指标能够进行比较和加权。*
从经验上说，归一化是让不同维度之间的特征在数值上有一定比较性，可以大大提高分类器的准确性。
目前数据标准化方法有多种，归结起来可以分为直线型方法(如极值法、标准差法)、折线型方法(如三折线法)、曲线型方法(如半正态性分布)。不同的标准化方法，对系统的评价结果会产生不同的影响，然而不幸的是，在数据标准化方法的选择上，还没有通用的法则可以遵循。
其中最典型的就是数据的归一化处理，即将数据统一映射到[0,1]区间上。
标准化*
标准化数据通过减去均值然后除以方差（或标准差），这种数据标准化方法经过处理后数据符合标准正态分布，即均值为0，标准差为1，转化函数为：

x =(x - 𝜇)/𝜎

适用于：如果数据的分布本身就服从正态分布，就可以用这个方法。

通常这种方法基本可用于有outlier的情况，但是，在计算方差和均值的时候outliers仍然会影响计算。所以，在出现outliers的情况下可能会出现转换后的数的不同feat**
z-score标准化方法适用于属性A的最大值和最小值未知的情况，或有超出取值范围的离群数据的情况。该种标准化方式要求原始数据的分布可以近似为高斯分布，否则效果会变得很糟糕。

最低0.47元/天解锁文章

SamWang_333

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
机器学习数据的标准化（normalization）和归一化

数据的标准化（normalization）和归一化数据的标准化（normalization）是将数据按比例缩放，使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到，去除数据的单位限制，将其转化为无量纲的纯数值，便于不同单位或量级的指标能够进行比较和加权。*从经验上说，归一化是让不同维度之间的特征在数值上有一定比较性，可以大大提高分类器的准确性。目前数据标准化方法有多种，归结起来...
复制链接

扫一扫

专栏目录