python机器学习入门及特征工程

一、特征抽取

sklearn.feature_extraction
字典特征提取
文本特征提取

二、特征预处理

将特征数据转换成更加适合算法模型的特征数据的过程

  • 归一化:变化原始数据实质映射到(默认[0,1])之间
    在这里插入图片描述
  • 标准化:将数据变换到均值为0 ,标准差为1的范围内,最值为异常值的情况归一化失效时可使用。

在这里插入图片描述在这里插入图片描述

三、特征降维

某些条件下降低随机变量(特征)个数,得到一组不相关变量的过程

  • 特征选择:从原有特征找出主要特征
    1)filter过滤式

    • 方差选择法:低方差特征过滤

    在这里插入图片描述

    • 相关系数法:特征与特征之间的相关程度,反映变量之间相关关系密切程度(皮尔逊系数pearson)

在这里插入图片描述

2)embeded嵌入式
决策树、正则化、深度学习
2. 主成分分析PCA:高维数据转换为低维数据的过程,可能会舍弃原有数据而创作新的变量。数据位数压缩,降低数据复杂度。
在这里插入图片描述在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值