数据归一化处理方法_数据预处理的 4 个方法

最新推荐文章于 2024-07-16 10:23:12 发布

weixin_39702639

最新推荐文章于 2024-07-16 10:23:12 发布

阅读量2.3k

点赞数

文章标签：数据归一化处理方法数据标准化处理方法

本文链接：https://blog.csdn.net/weixin_39702639/article/details/111280420

版权

本文介绍了数据预处理的重要性，并详细阐述了数据归一化和标准化的方法，以及如何处理分类型特征，包括编码和哑变量的转换。通过sklearn库展示了数据预处理的具体操作，如OneHotEncoder、OrdinalEncoder和Binarizer等工具的使用。

摘要由CSDN通过智能技术生成

在获取到数据集后会发现有的数据时有噪声，有异常，数据出错，量纲不一。

数据预处理的目的是让数据适应模型，匹配模型的需求，决定了后期数据输出的质量和价值。接下来演示下如何使用 sklearn 进行数据预处理。

数据归一化

数据归一化是将数据数据 x 按照最小值中心化后，再按照(最大值-最小值缩放)，将数据收敛到[0,1]之间

import pandas as pdfrom sklearn.preprocessing import MinMaxScaler# 创建数据集df = pd.DataFrame([[0,1],[-2,1],[5,10],[1,18]])# 实例化scaler = MinMaxScaler()# 使用fit训练模型scaler = scaler.fit(df)# 使用transform导出结果result = scaler.transform(df)result

array([[0.28571429, 0.        ],       [0.        , 0.        ],       [1.        , 0.52941176],       [0.42857143, 1.        ]])

数据标准化

将 x 按照均值中心化后，在按照标准差缩放，数据服从均值为 0 方差为 1 的正态分布。

公式为：(x-均值)/标准差

from sklearn.preprocessing import Stand

最低0.47元/天解锁文章

weixin_39702639

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫