数据处理——归一化 标准化 缺失值

from sklearn.preprocessing import MinMaxScaler  # 归一化
from sklearn.preprocessing import StandardScaler  # 标准化
from sklearn.impute import SimpleImputer
import numpy as np

# 归一化
# x'=(x-min)/(max-min)
mm = MinMaxScaler(feature_range=(0, 3))  # 范围
data = mm.fit_transform([[90, 2, 10, 40], [60, 4, 15, 45], [75, 3, 13, 46]])
print(data)
# 使某一个特征不会对结果造成太大影响
# 注意在特定场景下非常容易受异常点影响,所以这种方法鲁棒性较差,
# 只适合传统精确小数据场景。

# 标准化
# x'=(x-mean)/sigma
ss = StandardScaler()
data = ss.fit_transform([[90, 2, 10, 40], [60, 4, 15, 45], [75, 3, 13, 46]])
print(data)
# 在已有样本足够过的情况下比较稳定,适合现代嘈杂数据场景

# 缺失值
si = SimpleImputer(missing_values=np.NAN, strategy='mean')
data=si.fit_transform([[1,2],[np.NAN,3],[7,6]])
print(data)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

支持向量奇

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值