详解特征归一化

最新推荐文章于 2024-03-30 14:58:55 发布

ybdesire

最新推荐文章于 2024-03-30 14:58:55 发布

阅读量1.7w

点赞数 10

分类专栏： Machine Learning Python 源码分析文章标签：机器学习

本文链接：https://blog.csdn.net/ybdesire/article/details/56027408

版权

Machine Learning 同时被 3 个专栏收录

109 篇文章 16 订阅

订阅专栏

Python

76 篇文章 1 订阅

订阅专栏

源码分析

28 篇文章 0 订阅

订阅专栏

介绍

机器学习中，提取某个样本特征的过程，叫特征工程。
同一个样本，可能具备不同类型的特征，各特征的数值大小范围不一致。所谓特征归一化，就是将不同类型的特征数值大小变为一致的过程。

举例：假设有4个样本及他们的特征如下

样本	特征1	特征2
1	10001	2
2	16020	4
3	12008	6
4	13131	8

可见归一化前，特征1和特征2的大小不是一个数量级。归一化后，特征变为

样本	特征1	特征2
1	0	0
2	1	0.33
3	0.73	0.67
4	0.81	1

特征归一化有很多不同的叫法，比如：特征缩放，Feature Normalization，Feature Scaling，其实都是同一个意思。

特征归一化的意义

各特征之间的大小范围一致，才能使用距离度量等算法
加速梯度下降算法的收敛
在SVM算法中，一致化的特征能加速寻找支持向量的时间
不同的机器学习算法，能接受的输入数值范围不一样

两种常用特征归一化方法

下面详细介绍sklearn中最常用的特征归一化方法MinMaxScaler和StandardScaler。

MinMaxScaler

使用

在sklearn中，sklearn.preprocessing.MinMaxScaler是一种用于特征归一化的方法。使用示例如下

from sklearn.preprocessing import MinMaxScaler
x=[[10001,2],[16020,4],[12008,6],[13131,8]]
min_max_scaler = MinMaxScaler()
X_train_minmax = min_max_scaler.fit_transform(x)#归一化后的结果
X_train_minmax
array([[ 0.        ,  0.        ],
       [ 1.        ,  0.33333333],
       [ 0.33344409,  0.66666667],
       [ 0.52001994,  1.        ]])

它默认将每种特征的值都归一化到[0，1]之间，归一化后的数值大小范围是可调的（根据MinMaxScaler的参数feature_range调整）。下面代码能将特征归一化到[-1,1]之间。

min_max_scaler = MinMaxScaler(feature_range=(-1,1))
X_train_minmax = min_max_scaler.fit_transform(x)#归一化后的结果
X_train_minmax
array([[-1.        , -1.        ],
       [ 1.        , -0.33333333],
       [ 0.46574339,  0.33333333],
       [ 0.6152873 ,  1.        ]])

实现

MinMaxScaler的实现公式如下

X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))
X_scaled = X_std * (max - min) + min

这是向量化的表达方式，说明X是矩阵，其中

X_std：将X归一化到[0，1]之间
X.min(axis=0)表示列最小值
max，min表示MinMaxScaler的参数feature_range参数。即最终结果的大小范围

以下例说明计算过程（max=1，min=0）

样本	特征1	特征2
1	10001	2
2	16020	4
3	12008	6
4	13131	8
X.max	16020	8
X.min	10001	2

归一化的过程如下，假设归一化后的矩阵为S

S11=(10001-10001)/(16020-10001)=0
S21=(16020-10001)/(16020-10001)=1
S31=(12008-10001)/(16020-10001)=0.333444
S41=(13131-10001)/(16020-10001)=0.52002
S12=(2-2)/(8-2)=0
S22=(4-2)/(8-2)=0.33
S32=(6-2)/(8-2)=0.6667
S42=(8-2)/(8-2)=1

可见，结果与章节“MinMaxScaler使用”中的计算结果一致。

StandardScaler

使用

在sklearn中，sklearn.preprocessing.StandardScaler是一种用于特征归一化的方法。使用示例如下

from sklearn.preprocessing import StandardScaler
x=[[10001,2],[16020,4],[12008,6],[13131,8]]
X_scaler = StandardScaler()
X_train = X_scaler.fit_transform(x)
X_train
array([[-1.2817325 , -1.34164079],
       [ 1.48440157, -0.4472136 ],
       [-0.35938143,  0.4472136 ],
       [ 0.15671236,  1.34164079]])