作用
当样本的各个特征的数量级相差较大,那么不同特征对模型的影响也会有较大的差别。为了使每个特征都具有相同的重要性,通过归一化(标准化),来把所有特征的范围化为同一量级。
-
使用梯度下降法求解最优化问题的数值解的时候,归一化的优势:
1 可以提升模型的收敛速度。归一化后优化形状变为圆形,梯度方向直指圆心,迭代速度变快,大大减少寻找最优解的时间;
2 提升模型的精度。设计距离计算时,数量级小的特征对结果的影响远远小于数量级大的特征,对精度造成损失,归一化可以使各个特征对结果做出的贡献相同。
常见方法
- Standardization
利用均值与标准差来计算,最终取值范围是[-1 , 1] - Min-Max Scaling
利用最小值和最大值来计算,取值范围是[0 , 1]
应用
- KNN中、岭回归