特征处理方法总览:
标准化和归一化介绍:
(1)标准化
标准化需要计算特征的均值和标准差,公式表达为:
使用preproccessing库的StandardScaler类对数据进行标准化的代码如下
from sklearn.preprocessing import StandardScaler
from sklearn.datasets import load_iris
iris=load_iris()
#标准化,返回值为标准化后的数据
StandardScaler().fit_transform(iris.data)
(2)归一化
使用preproccessing库的Normalizer类对数据进行归一化的代码如下:
from sklearn.preprocessing import Normalizer
#归一化,返回值为归一化后的数据
Normalizer().fit_transform(iris.data)
区间缩放法其实是归一化的一种: