1、min_max方法:
公式很简单(x - min) / (max - min),一般用于处理有确切上下界样本。
2、z_score方法:
公式为:x* = (x - μ ) / σ,假设样本服从正态分布,一般用于处理无界且有均值的样本。
上述两种方法最常见的归一化方法,但预测数据可能大于max,或者小于min;或者不符合以前的均值方差,会造成一定误差。
3、非线性变换:
logisit函数或者正切函数,这样可以使得所有的数据得到一个普适的处理;但是由于函数的凹凸性,数据较大的样本会抹掉其基本特征。