规范化:将属性数据按比例缩放,使之落入一个小的特定区间
1)最小—最大规范化:假定minA和maxA分别为属性A的最小和最大值,则通过下面公式将A的值映射到区间[new_minA, new_maxA]中:
2)z-score规范化(零均值规范化):
将属性A的值根据其平均值和标准差进行规范化;
常用于属性最大值与最小值未知,或使用最小最大规范化方法会出现异常数据的情况。
其中,meanA、 standard_devA分别为属性A取值的均值和标准差。
3)小数定标规范化:通过移动属性A的小数点位置进行规范化,小数点的移动依赖于A的最大绝对值