StandarScaler

数据在前处理的时候,经常会涉及到数据标准化。将现有的数据通过某种关系,映射到某一空间内。常用的标准化方式是,减去平均值,然后通过标准差映射到均至为0的空间内。系统会记录每个输入参数的平均数和标准差,以便数据可以还原。

很多ML的算法要求训练的输入参数的平均值是0并且有相同阶数的方差。

StandardScaler能够轻松的实现上述功能。

定义:

sc = StandarScaler(copy=True, with_mean=True, with_std=True)

三个默认值为True。

copy 如果为False,就会用归一化的值替代原来的值。如果被标准化的数据不是np.array或scipy.sparse CSR matrix, 原来的数据还是被copy而不是被替代。

归一化的值:表示一个事物有不同的维度{即:属性},每个属性的取值范围不同,导致计算时此属性占用的权重不同。

with_mean 在处理sparse CSR或者 CSC matrices 一定要设置False不然会超内存。

可查询属性:

scale_:缩放比例或标准差。

mean_:特征平均值

var_:特征方差

n_sample_seen_:样本数量(可增加)

可被调用的方法:

fit:计算输入数据各特征的平均值

fit_transform:通过fit_params调整数据X,y得到一个调整后的X 

get_params:返回StandardScaler对象的设置参数

inverse_transform:按照缩放规律反向还原当前数据

partial_fit:计算平均值和标准差

transform:基于现有的对象规则,标准化新的参数

 

  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值