在某些问题中,数据归一化是必不可少的。
线性归一化
公式:
该方法实现对原始数据的等比例缩放,X为原始数据,Xmax、Xmin分别为原始数据集的最大值和最小值。
此归一化方法的优缺点为
优点:
如果方差较小,可以使用此方法将特征差异放大
缺点:
容易受到数据的影响,如噪音,或者最大值最小值太极端的情况。
零均值归一化
其中X是原数据,其中
是原数据的均值,
是原数据的方差。
此归一化方法的优缺点为:
优点:
将所有数据都归一到均值为0,方差为1的正态分布<br>
缺点:
对于不满足高斯分布的数据归一化后的结果较差