数据挖掘中,在训练模型之前,需要对特征进行一定的处理,最常见的处理方式之一就是数据的规范化。数据的规范化的作用主要有两个:去掉量纲,使得指标之间具有可比性;将数据限制到一定区间,使得运算更为便捷。归一化就是典型的数据规范化方法,常见的数据规范化方法如下:
1、线性函数归一化(Min-Max scaling)
线性函数将原始数据线性化的方法转换到[0, 1]的范围。计算公式如下:
在不涉及距离度量、协方差计算、数据不符合正太分布的时候,使用该方法比较好。
2、0均值标准化
数据挖掘中,在训练模型之前,需要对特征进行一定的处理,最常见的处理方式之一就是数据的规范化。数据的规范化的作用主要有两个:去掉量纲,使得指标之间具有可比性;将数据限制到一定区间,使得运算更为便捷。归一化就是典型的数据规范化方法,常见的数据规范化方法如下:
1、线性函数归一化(Min-Max scaling)
线性函数将原始数据线性化的方法转换到[0, 1]的范围。计算公式如下:
在不涉及距离度量、协方差计算、数据不符合正太分布的时候,使用该方法比较好。
2、0均值标准化