使用特征缩放的作用是:
- 使不同量纲的特征处于同一数值量级,减少方差大的特征的影响,使模型更准确。
- 加快学习算法的收敛速度。
缩放过程可以分为以下几种:
- 缩放到均值为0,方差为1(Standardization——StandardScaler())
- 缩放到0和1之间(Standardization——MinMaxScaler())
- 缩放到-1和1之间(Standardization——MaxAbsScaler())
- 缩放到0和1之间,保留原始数据的分布(Normalization——Normalizer())
1就是常说的z-score归一化,2是min-max归一化。
画出原始数据图像为:
使用1.StandardScaler()缩放,结果为: