![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
特征工程
文章平均质量分 64
大范先生
这个作者很懒,什么都没留下…
展开
-
有关项目:预测贷款用户是否逾期的特征处理
这是对前一个项目:预测贷款用户是否逾期的数据进行提前准备工作,即特征处理,主要包括数据类型转换和缺失值处理。一、特征处理对拿到的金融数据进行直观分析,删除无关特征,避免过拟合# 删除无关信息dataset = dataset.drop(["custid","trade_no","bank_card_no","id_name","first_transaction_time","lates.原创 2018-11-22 18:52:33 · 1769 阅读 · 0 评论 -
特征筛选———贷款用户是否会逾期
一、学习要求分别对前面预处理的数据使用IV值和随机森林进行特征筛选二、基础知识1、IV值计算过程是根据该特征所命中黑白样本的比率与总黑白样本的比率,来对比和计算其关联程度IV 值的取值范围是[0, ∞ ),但一般具有中等IV值的变量来进行模型开发,如下所示IV值预测能力<0.02无用0.02-0.1弱预测0.1-0.3中等预测0.3-...原创 2018-11-29 10:23:19 · 377 阅读 · 0 评论