【机器学习】特征工程—— 特征预处理

特征工程是提高预测模型准确性的关键步骤,主要包括特征抽取、预处理和数据降维。特征预处理涉及数值型数据的归一化、标准化和缺失值处理。归一化通过MinMaxScaler将数据映射到[0, 1],适用于小数据场景;标准化使用StandardScaler将数据转换到均值为0,方差为1,适用于大数据场景。对于缺失值,可以采用删除或插补策略处理。" 112750780,10535658,5.8G雷达感应模块:稳定性与应用解析,"['微波感应模块', '5.8G雷达', '感应技术', '物联网', '智能照明']
摘要由CSDN通过智能技术生成

特征工程

定义:将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的预测准确性。
内容:主要有三部分:
  1、特征抽取
  2、特征预处理
  3、数据的降维

特征预处理

特征预处理:通过特定的统计方法(数学方法)将数据转换成算法要求的数据。

1、包含内容

  • 数值型数据:标准缩放,包括归一化、标准化、缺失值
  • 类别型数据:one—hot编码
  • 时间类型:时间的切分

2、sklearn特征处理API:

sklearn.preprocessing

一、归一化

1、特点

通过对原始数据进行变换把数据映射到[0, 1](默认)之间

2、公式

x ′ = x − m i n m a x − m i n x'=\frac{x-min}{max-min} x=maxminxmin x ′ ′ = x ′ ( m x − m i ) + m i x''=x'(mx-mi)+mi x=x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值