35 实战微额借款用户人品预测

最新推荐文章于 2020-03-12 14:15:54 发布

《一夜飘零》

最新推荐文章于 2020-03-12 14:15:54 发布

阅读量8.2k

点赞数 1

本文链接：https://blog.csdn.net/jiaxinhong/article/details/81809825

版权

55 篇文章 1 订阅

订阅专栏

做什么

通过数据挖掘来分析小额微贷申请借款用户的信用状况，以分析其是否逾期

数据在这里，链接: https://pan.baidu.com/s/1b2WZnS 密码: crka

数据来源于CashBUS现金巴士赞助的微额借款用户人品预测大赛，经CashBUS授权使用

冠军团队：不得直视本王

数据概况

缺失值处理

统计train_x、test_x、train_unlabeled中，1138维特征的缺失情况并绘图

缺失值数量区间化，去掉缺失值数量大于194的行（可能引入噪声，造成过拟合）

特征工程

特征选择

基于XGBoost，在训练模型时，对特征重要性进行排序，以进行特征选择

模型设计

1 单模型

XGBoost、SVM等，0.717

2 Bagging of XGBoost

36个XGBoost模型：

特征多样：保留topN1个原始特征、topN2个排序特征、topN3个离散特征、10个计数特征，N1、N2、N3分别在300-500、300-500、64-100的范围内随机选择
模型多样：XGBoost的各项参数在经调优的最佳值附近小范围抖动
融合！0.725

3 多模型融合

XGboost的Py、R、Java版本，BoX，SVM，加权融合，0.7279

4 迭代半监督

用最好的模型预测无标签数据，并保留融合后能提升性能的数据

5 暴力半监督

更加详细的内容

全过程演示+手敲代码，课程筹备中，敬请期待！

关注

专栏目录

35 实战 微额借款用户人品预测