一、数据归一化的作用
当数据集中不同特征项的范围相差较大时,必须要进行归一化处理,否则目标函数的图像会变“扁”,梯度下降时会走很多弯路。
比如,假设有两种数值型特征,x1的取值范围为[0,10],x2的取值范围为[0,3],可以得到归一化和未归一化的梯度下降的路径如下图:
因此归一化的好处有:
1.能够加快梯度下降求最优解的速度;
2.有可能提高精度。
二、归一化的方式
1.Min-Max归一化:将值映射到[0,1]范围。
x ′ = x − min ( x ) max ( x ) − min ( x ) x'=\dfrac{x-\min \left( x\right) }{\max \left( x\right) -\min \left( x\right) } x′=max(x)−