数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。这样去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。其中最典型的就是0-1标准化和Z标准化。下面介绍常见的几种方法:
1.最小-最大规范化
其中max_A为样本数据的最大值,min_A为样本数据的最小值。这种方法有一个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义。
2.z-score规范化
mean_A 为所有样本数据的均值, stand_dev_A为所有样本数据的标准差。
3.
小数定标规范化
其中j是使得Max(| |)<1的最下整数。