风控ML[17] | 风控建模中怎么做特征降维

1e86c15109c9bfe8d141f3491054097c.png

00 Index

01 为什么要做特征降维?
02 主成分分析PCA原理与实现
03 线性判别分析LDA原理与实现
04 特征选择之过滤法(Filter)原理与实现
05 特征选择之包裹法(Wrapper)原理与实现
06 特征选择之嵌入法(Embedding)原理与实现
07 总结一下

🎭 01 为什么要做特征降维?

当我们在用LR(逻辑回归)做评分卡的时候,其实遇到需要特征降维的机会并不多,但是如果我们是用经典机器学习算法(比如XGBoost、GBDT等)来建模的话,就有很大的概率会需要我们去做特征降维的工作,因为这类的算法模型首先不要求特征必须要有解释性,第二就是也不用过多地去考虑变量间的相关性,可以放心大胆地去衍生特征。
因此数据维度爆炸就很有可能发生,而当我们的模型如果入参太多的话就需要更多的时间和资源去训练,而现实中是不允许的,所以我们需要对特征进行处理,提取对预测更加有效果的特征。
而特征降维,可以让我们在减少维度的同时可以尽可能地获取更加有效的信息(剔除冗余和噪声,必要时牺牲一些特征信息),这样子做一来可以提高特征表达的能力,二来可以提高模型训练的效率

🎭 02 主成分分析PCA原理与实现

PCA,全称Principal Components Analysis,中文是主成分分析,是特征降维中比较经典的一种方法。它是一种线性的、无监督的、全局性的降维算法,目标就是要找到数据中的“主要成分”,提取主成分从而达到特征降维的效果。它的一个比较明显的优势就是不需要标签都可以进行特

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值