数据变换
Normalization means converting vectors to unit vectors.
min-max normalization
v is input value
new_max and new_min 是线性变换后的区间长度, 最小-最大规范化就是对原始数据区间进行线性变换。
z-score normalization
A 的 值 v 被规范化为 v’
此情况是在属性 A 的最大和最小值未知,或局外者左右了最大-最小规范化时使用
normalization by decimal scaling
小数定标规范化通过移动属性 A 的小数点位置进行规范化。小数点的移动位数依赖于 A 的最大 绝对值。A 的值 v 被规范化为 v’,由下式计算:
其中,j 是使得 Max(|v’|) < 1 的最小整数