机器学习python数据预处理

from pandas import read_csv
from sklearn.preprocessing import StandardScaler
from numpy import set_printoptions
from sklearn.preprocessing import MinMaxScaler
from sklearn.preprocessing import Normalizer
from sklearn.preprocessing import Binarizer

filename = 'pima_data.csv'
names = ['preg','plas','pres','skin','test','mass','pedi','age','class']
data = read_csv(filename,names = names)
array = data.values
X = array[:,0:8]
Y = array[:,8]

#-----调整数据尺度-----
'''将数据缩放到一个指定范围,或者对数据进行标准化并将数据都聚集到0附近,方差为1'''
transformer = MinMaxScaler(feature_range=(0,1))
#数据转换
newX = transformer.fit_transform(X)
set_printoptions(precision=3)
#print(newX)

#-----正态化数据-------
'''处理符合高斯分布的数据的手段,输出以0为中位数,方差为1'''
transformer = StandardScaler().fit(X)
newX = transformer.transform(X)
set_printoptions(precision=3)
#print(newX)

#------标准化数据-------
'''将每一行的数据的距离处理为1,适合处理稀疏数据'''
transformer = Normalizer().fit(X)
newX = transformer.transform(X)
set_printoptions(precision=3)
#print(newX)

#-------二值数据------
'''使用值将数据转化为二值,大于阈值为1,小于阈值为0'''
transformer = Binarizer(threshold=0.0).fit(X)
newX = transformer.transform(X)
set_printoptions(precision=3)
#print(newX)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值