sklearn 笔记：数据归一化（StandardScaler）

最新推荐文章于 2025-08-16 11:18:57 发布

原创最新推荐文章于 2025-08-16 11:18:57 发布 · 1.1w 阅读

37 ·

CC 4.0 BY-SA版权

文章标签：

#sklearn #python #机器学习

python库整理专栏收录该内容

349 篇文章

订阅专栏

本文介绍了StandardScaler的原理，它是用于数据预处理的工具，执行去均值和方差归一化。通过sklearn库展示了如何实现数据的标准化和逆变换。fit_transform方法结合了拟合和转换步骤，而transform仅做转换，不能直接替换fit_transform。逆变换则用于将标准化数据恢复为原始形式。

1 StandardScaler原理

去均值和方差归一化。且是针对每一个特征维度来做的，而不是针对样本。

，其中μ为所有样本数据的均值，σ为所有样本数据的标准差。

2 用sklearn 实现数据归一化

from sklearn.preprocessing import StandardScaler  # 标准化工具
import numpy as np
 
x_np = np.array([[100, -1., 2.],
                [2., 0., 0.],
                [-1,-2,1]])
scaler = StandardScaler()
x_train = scaler.fit_transform(x_np)
print(x_train)
'''
[[ 1.4137317   0.          1.22474487]
 [-0.67489704  1.22474487 -1.22474487]
 [-0.73883466 -1.22474487  0.        ]]
'''

3 fit_transform 和transform的区别

fit_transform是fit和transform的组合。相当于先fit，再tranform（先拟合数据，再标准化）
fit(x,y)传两个参数的是有监督学习的算法，fit(x)传一个参数的是无监督学习的算法(比如降维、特征提取、标准化)
fit和transform没有任何关系，之所以出来这么个函数名，仅仅是为了写代码方便，所以会发现transform（）和fit_transform（）的运行结果是一样的。
运行结果一模一样不代表这两个函数可以互相替换，绝对不可以！transform函数是一定可以替换为fit_transform函数的，fit_transform函数不能替换为transform函数！

4 inverse_transform

将标准化后的数据转换为原始数据。


from sklearn.preprocessing import StandardScaler  # 标准化工具
import numpy as np
 
x_np = np.array([[100, -1., 2.],
                [2., 0., 0.],
                [-1,-2,1]])
scaler = StandardScaler()
x_train = scaler.fit_transform(x_np)

x_train 
'''
array([[ 1.4137317 ,  0.        ,  1.22474487],
       [-0.67489704,  1.22474487, -1.22474487],
       [-0.73883466, -1.22474487,  0.        ]])
'''


x_train=np.int32(scaler.inverse_transform(x_train))
x_train
'''
array([[100,  -1,   2],
       [  1,   0,   0],
       [ -1,  -2,   1]])
'''