量纲的特征缩放
1 标椎化缩放法
x = x − X ‾ S x = \cfrac{x-\overline X}{S} x=Sx−X
1.1 对简单实例二维矩阵的列数据
from sklearn import preprocessing
import numpy as np
采用numpy的array表示,因为要用到其mean等函数,而list没有这些函数
X = np.array([[0, 0],
[0, 0],
[100, 1],
[1, 1]])
X
计算
平均数
X_mean = X.mean(axis=0)
X_mean
计算
方差
X_std = X.std(axis=0)
X_std
标椎化
X
X_1 = (X - X_mean) / (X_std)
X_1
使用
sklean.preprocessing.scale
函数
X_scale = preprocessing.scale(X)
X_scale
1.2 对iris数据二维矩阵的列数据进行
from sklearn import datasets
iris = datasets.load_iris()
iris.data
X_scale = preprocessing.scale(iris.data)
X_scale
2 区间缩放法
x = x − X ‾ S x = \cfrac{x-\overline X}{S} x=Sx−X
2.1 对简单实例二维矩阵的列数据进行
max_, min_ = feature_range=(0, 1)
max_, min_
X_scaled = ((X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))) * (max_ - min_) + min_
X_scaled
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
scaler
scaler.fit(X)
scaler.transform(X)
2.2 对iris数据二维矩阵的列数据进行
scaler.fit(iris.data)
scaler.transform(iris.data)