1、定义
数据的归一化处理,即将数据统一映射到[0,1]区间上。
2、方法
1)最大最小标准化(Min-Max Normalization)
本归一化方法又称为离差标准化,使结果值映射到[0 ,1]之间,转换函数如下:
应用场景:
在不涉及距离度量、协方差计算、数据不符合正太分布的时候,可以使用第一种方法或其他归一化方法(不包括Z-score方法)。比如图像处理中,将RGB图像转换为灰度图像后将其值限定在[0,255]的范围。
2)Z-score标准化方法
数据处理后符合标准正态分布,即均值为0,标准差为1,其转化函数为:
其中μ为所有样本数据的均值,σ为所有样本数据的标准差。
应用场景:在分类、聚类算法中,需要使用距离来度量相似性的时候、或者使用PCA技术进行降维的时候,Z-s