特征预处理

本文介绍了特征预处理的重要步骤,包括归一化和标准化处理,强调在大数据场景下标准化的优势。对于缺失值,推荐使用SimpleImputer进行插补。此外,探讨了数据降维的策略,如PCA,用于减少特征数量,并通过实例展示了PCA在特征简化中的效果。
摘要由CSDN通过智能技术生成

特征预处理

归一化处理

在这里插入图片描述

MinMaxScaler语法

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UK0hIP6a-1614612105262)(D:%5CMarkDown%5Cimages%5Cimage-20210301182214628.png)]

from sklearn.preprocessing import MinMaxScaler
X = [[90,2,10,40],
     [60,4,15,45],
     [75,3,13,46]]
def mm():
    mm = MinMaxScaler(feature_range=(0,1))

    data = mm.fit_transform(X)

    print(data)

    return None
if __name__ == '__main__':
    mm()

结果:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OiUma90C-1614612105263)(D:%5CMarkDown%5Cimages%5Cimage-20210301175333139.png)]

说明:归一化处理对每一列都进行

MinMaxScaler(feature_range=(0,1))中 feature_range的范围就是全部数值归一化处理后的范围

标准化处理

StandardScaler语法

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dACOcfZg-1614612105265)(D:%5CMarkDown%5Cimages%5Cimage-20210301182052079.png)]

from sklearn.preprocessing import StandardScaler

X = 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值