官网链接:link
sklearn.preprocessing.StandardScaler
通过去除均值并将其缩放为单位方差来标准化特征样本x的标准得分计算为:
z = (x - u) / s
一些方法:
fit(X[, y]) 计算平均值和标准差,以用于以后的标度。
fit_transform(X[, y]) 拟合数据,然后对其进行转换。
例子:
data = np.array([[0, 0], [0, 0], [1, 1], [1, 1]])
print(data)
scalar = StandardScaler()
scalar.fit(data)
print(scalar.mean_, scalar.var_) # 每一列的均值和方差
print(scalar.transform(data)) # 转换数据需要另外再调用transform
# 如果想要一起fit和transform可以使用fit_transform()方法
[[0 0]
[0 0]
[1 1]
[1 1]]
[0.5 0.5] [0.25 0.25]
[[-1. -1.]
[-1. -1.]
[ 1. 1.]
[ 1. 1.]]