机器学习入门之特征预处理

背景

了解机器学习中数据预处理相关知识点。

数据无量纲化
标准化
from sklearn.preprocessing import StandardScaler
data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
​
scaler = StandardScaler()               #实例化
scaler.fit(data)                        #fit,本质是生成均值和方差
​
scaler.mean_                            #查看均值的属性mean_
scaler.var_                             #查看方差的属性var_
​
x_std = scaler.transform(data)          #通过接口导出结果
​
x_std.mean()                            #导出的结果是一个数组,用mean()查看均值
x_std.std()                             #用std()查看方差
​
scaler.fit_transform(data)              #使用fit_transform(data)一步达成结果
​
scaler.inverse_transform(x_std)         #使用inverse_transform逆转标准化
归一化
from sklearn.preprocessing import MinMaxScaler
​
data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
​
#不太熟悉numpy的小伙伴,能够判断data的结构吗?
#如果换成表是什么样子?
import pand
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值