机器学习-特征工程 基础知识总结

特征工程包括【特征构造】【数值处理】【特征选择】

1.【特征构造】数据和特征决定了机器学习的上限:切片静态特征,切片聚合特征,时序聚合特征

2.【数值处理】:标准/归一化;缺失值填充;分箱方法;特征编码;

分箱方法:

风控场景下的常用特征分箱介绍:BestKs分箱、卡方分箱、聚类分箱等 - 百度文库 (baidu.com)

风控建模中的分箱方法——原理与代码实现 - 知乎 (zhihu.com)

特征编码:

Label编码,one-hot编码,Target编码,模型自动编码,Embedding嵌入,WOE编码

3.【特征选择】:WOE(weight of evidence 证据权重),IV(Information value 信息价值,是woe的加权和),VIF(variance inflation factor 方差膨胀系数),PSI(population stability index 群体稳定性指标)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值