scikit-learn preprocessing模块

version:sklearn0.16.1
sklearn.preprocessing模块包括scaling, centering, normalization 和imputation方法。
包括

  • data.py 处理数据(均值,方差等)
  • label.py 二值化
  • _weight.py
  • imputation.py 缺失值处理

1.data.py

1._mean_and_std(X, axis=0, with_mean=True, with_std=True):

计算均值和标准差,标准差为0的话则置为1

2.scale(X, axis=0, with_mean=True, with_std=True, copy=True)

公式为:(X-mean)/std 计算时对每个属性/每列分别进行。

将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。
scale函数不能用来处理稀疏矩阵

3.class MinMaxScaler()

使特征标准化

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值