Day 42: 归一化,标准化,处理缺失值

Python 回忆录2021/1/24特征预处理归一化特点2021/1/24特征预处理其实就是把得到的数据样本,特征数据转换算法可用的数据。对于数值型数据,用到两大方法来预处理 : 1.归一化,2.标准化。还有缺失值的预处理对于类别型数据, 用one-hot编码来预处理对于时间类型数据,用时间切分方法来预处理归一化sklearn的预处理APIsklearn.preprocessing所有预处理方法都在这个模块里面特点通过对原始数据变化,映射到默认的[0,1]这个区间数据变化后最
摘要由CSDN通过智能技术生成

2021/1/24

特征预处理

在这里插入图片描述
其实就是把得到的数据样本,特征数据转换算法可用的数据。

  • 对于数值型数据,用到两大方法来预处理 : 1.归一化,2.标准化。还有缺失值的预处理
  • 对于类别型数据, 用one-hot编码来预处理
  • 对于时间类型数据,用时间切分方法来预处理

归一化

sklearn的预处理APIsklearn.preprocessing所有预处理方法都在这个模块里面

特点

通过对原始数据变化,映射到默认的[0,1]这个区间
在这里插入图片描述
数据变化后最终的数字是X"

目的是为了某一个特征不会对最终结果造成更大影响

MinMaxScaler

MinMaxScaler(feature_range = (0,1)...): 每个特征会缩放到指定范围(默认[0,1])

-MinMaxScaler.fit_transform(x): X:numpy array格式的数据[n_samples,n_features]. 返回一个转换后相同形状的array

归一化总结

在特定场景下最大值和最小值 很容易受到异常点的影响,所以这种归一化的鲁棒性(反应产品稳定的词)较差,只适合传统精确小数据场景(平常应用中很少有这样的场景,所以也很少用归一化)。

标准化

特点

通过对原始数据进行变换把数据变换到均值为0,标准差为1的范围内。
在这里插入图片描述

目的也是为了某一个特征数据不会对最终结果造成更大的影响。

StandarScaler

标准化的APIsclkit-learn.preprocessing.St

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值