让不同特征数据的取值范围是一样的,不使得特征的重要程度受数据数量级大小的影响
1、数据归一化(norablization)
将数据转化为一个在0-1之间上的数,计算公式为(x-min)/(max-min)
2、标准化
可以指定范围,例如将数据均压缩到[-1,1]上
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
X = scaler.fit_transform(X)
让不同特征数据的取值范围是一样的,不使得特征的重要程度受数据数量级大小的影响
1、数据归一化(norablization)
将数据转化为一个在0-1之间上的数,计算公式为(x-min)/(max-min)
2、标准化
可以指定范围,例如将数据均压缩到[-1,1]上
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
X = scaler.fit_transform(X)