『sklearn学习』preprocessing函数——数据预处理

# 数据预处理
from sklearn import preprocessing
from sklearn import datasets

import numpy as np

boston = datasets.load_boston()
X, y = boston.data, boston.target
print X[:, :3].mean(axis=0)
print X[:, :3].std(axis=0)

# 缩放
X_2 = preprocessing.scale(X[:, :3])
print X_2.mean(axis=0)
print X_2.std(axis=0)

# 标准化,把特征值的样本均值变成 0,标准差变成 1
my_scaler = preprocessing.StandardScaler()
print my_scaler.fit(X[:, :3])
print my_scaler.transform(X[:, :3]).mean(axis=0)

# 标准化,将样本数据根据最大值和最小值调整到区间内,默认是 [0, 1]
my_minmax_scaler = preprocessing.MinMaxScaler()
my_minmax_scaler.fit(X[:, :3])
print my_minmax_scaler.transform(X[:, :3]).max(axis=0)
# 将默认区间修改为指定的区间
my_odd_scaler = preprocessing.MinMaxScaler(feature_range=(-3.14, 3.14))
my_odd_scaler.fit(X[:, :3])
print my_odd_scaler.transform(X[:, :3]).max(axis=0)

# 标准化,正态化,它会将每个样本长度标准化为 1
normalized_x = preprocessing.normalize(X[:, :3])
print normalized_x
# normalized_x 并没有 fit 属性,且 normalized_x 是一个 array 数组

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值