数据预处理

最新推荐文章于 2024-07-09 14:17:32 发布

一个两个n多个

最新推荐文章于 2024-07-09 14:17:32 发布

阅读量1.5k

点赞数

分类专栏：学习文章标签：数据预处理

本文链接：https://blog.csdn.net/bug_12/article/details/95338284

版权

本文介绍了数据预处理的方法，包括StandardScaler、MinMaxScaler、RobustScaler和Normalizer。通过实例展示它们如何改变数据分布，并指出预处理对于提高模型准确率的重要性。在未预处理的数据集上，MLP模型得分仅为0.31，但经过MinMaxScaler预处理后，模型准确率提升至0.96。

摘要由CSDN通过智能技术生成

1、预处理方法

1.1 StandardScaler

StandardScaler方法的原理是将所有数据的特征值转换为均值为0，方差为1的状态，也就是标准正态分布。这样可以确保数据的“大小”是一致的，更有利于模型的训练。
使用方法如下：

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.preprocessing import StandardScaler
#创造数据
X,y = make_blobs(n_samples=40,centers=2,random_state=50,cluster_std=2)
scaler = StandardScaler()
X_scalered = scaler.fit_transform(X)
#作图
plt.scatter(X_scalered[:,0],X_scalered[:,1],c=y,cmap=plt.cm.cool)
plt.title("StandardScaler")
plt.show()

运行结果如下：
在这里插入图片描述
从上图可以看到所有的数据的特征值1的值都在-2到3之间，而特征值2的值都在-3到2之间了。

1.2MinMaxScaler

MinMaxScaler对数据的缩放主要在于将所有数据的特征值都转换到0到1之间。可以想象成将数据都压进了一个长和宽都

最低0.47元/天解锁文章

一个两个n多个

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
数据预处理

1、预处理方法1.1 StandardScalerStandardScaler方法的原理是将所有数据的特征值转换为均值为0，方差为1的状态，也就是标准正态分布。这样可以确保数据的“大小”是一致的，更有利于模型的训练。使用方法如下：import numpy as npimport matplotlib.pyplot as pltfrom sklearn.datasets import m...
复制链接

扫一扫

专栏目录