四种数据预处理方式的区别?

数据预处理可以提高模型的准确率

首先导入numy模块,和画图模块matplotlib
使用sklearn模块中的make_blobs手工生成一些数据集
本列数据集中的两个特征分别对应于x轴和y轴

示例代码以及不同的数据预处理结果如下:

import numpy as np
import matplotlib.pyplot as plt
#导入数据集生成工具
from sklearn.datasets import make_blobs
X,y=make_blobs(n_samples=40,centers=2,random_state=50,cluster_std=2)
#用散点图画图
plt.scatter(X[:,0],X[:,1],c=y,cmap=plt.cm.cool)
#显示图像
plt.show()

在这里插入图片描述

print(’========================’)

#对数据进行预处理

#导入数据预处理模块,第一种方法
#导入StandardScaler

from sklearn.preprocessing import StandardScaler
#使用上述模块进行数据预处理
X_1=StandardScaler().fit_transform(X)

#打印出预处理后的图像
plt.scatter(X_1[:,0],X_1[:,1],c=y,cmap=plt.cm.cool)
plt.show()

在这里插入图片描述

print(’====================’)
#第二种方法:使用MinMaxScaler进行数据预处理
#daoru MinMaxScaler
from sklearn.preprocessing import MinMaxScaler
#使用MinMaxScaler进行数据预处理
X_2=MinMaxScaler().fit_transform(X)
plt.scatter(X_2[:,0],X_2[:,1],c=y,cmap=plt.cm.cool)
plt.show()
在这里插入图片描述

print(’========================’)

#第三种方式,使用RobustScaler进行数据预处理

#导入RobustScaler
from sklearn.preprocessing import RobustScaler
#使用上述模块进行数据预处理
X_3=RobustScaler().fit_transform(X)
plt.scatter(X_3[:,0],X_3[:,1],c=y,cmap=plt.cm.cool)
plt.show()
在这里插入图片描述

print(’=================’)

#第四种方式,使用Normalizaer进行数据预处理
#导入Normalizaer
from sklearn.preprocessing import Normalizer
#使用上述模块进行数据预处理
X_4=Normalizer().fit_transform(X)
plt.scatter(X_4[:,0],X_4[:,1],c=y,cmap=plt.cm.cool)
plt.show()
在这里插入图片描述

print(’======================’)

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值