常见的数据归一化方法有min-max标准化 和 z-score 标准化
min-max标准化
对原始数据的线性变换
使结果落到[0,1]区间
x* = (x - x_mean)/(x_max - x_min) 将数据映射到[-1,1]区间,或者x* = x* * 2 -1
z-score 标准化
最常见的标准化方法就是Z标准化,也叫标准差标准化。要求原始数据的分布可以近似为高斯分布,否则归一化的效果会变得很糟糕
x* = (x - μ ) / σ 适用于属性的最大值和最小值未知的情况,或有超出取值范围的离群数据的情况。