Python scikit-learn，数据的预处理，标准化，StandardScaler

最新推荐文章于 2024-12-14 16:26:19 发布

houyanhua1

最新推荐文章于 2024-12-14 16:26:19 发布

阅读量7.6k

点赞数 3

分类专栏： Python+ 机器学习文章标签： Python 标准化数据预处理 StandardScaler

本文链接：https://blog.csdn.net/houyanhua1/article/details/87907632

版权

Python+ 同时被 2 个专栏收录

262 篇文章 20 订阅

订阅专栏

机器学习

38 篇文章 15 订阅

订阅专栏

标准化的目的与归一化一样，都是为了避免某个特征的重要程度过大或过小。

标准化的优点：受异常点的影响较小。适用于繁杂大数据。

demo.py（scikit-learn，数据的预处理，标准化，StandardScaler）：

from sklearn.preprocessing import StandardScaler


# 标准化处理
std = StandardScaler()
# （fit_transform()等同于fit()填充数据 + tansform()转换数据）(tansform转换器转换数据时所依赖的均值、标准差等取决于fit()填充的数据)
data = std.fit_transform([[ 1., -1., 3.],[ 2., 4., 2.],[ 4., 6., -1.]])
print(std.mean_)  # [2.33333333 3. 1.33333333]  每列的平均值

print(data)
'''
[[-1.06904497 -1.35873244  0.98058068]
 [-0.26726124  0.33968311  0.39223227]
 [ 1.33630621  1.01904933 -1.37281295]]

'''