- 博客(3)
- 收藏
- 关注
原创 数据挖掘项目:金融银行风控信用评分卡模型(下篇)
通过评分卡这个项目,熟悉了WOE和IV值,虽然对别的模型可能用处不大,但在银行风控领域很常用,另外,由于数据中有很多的异常值不知道该怎么处理时,也见识到了数据分箱这种方法的强大。
2023-04-25 21:18:01 1499 2
原创 数据挖掘项目:金融银行风控信用评分卡模型(上篇)
银行领域评分卡一般分为四种,A、B、C、F卡:A卡表示为贷前评分卡。B卡表示为贷中评分卡。C卡表示为贷后评分卡。F卡表示为反欺诈评分卡。通过对数据进行探索性分析,更加了解数据,从中观察出数据的一些规律和问题,这样在后续的预处理过程中,也能有些思路。接下来是对数据进行分箱。使用toad这个专门的评分卡库自动分箱并构建逻辑回归模型来进行预测,并利用ROC-AUC和KS进行评估。再和使用手动分箱的方式进行对比,最后建立评分卡。
2023-04-25 14:19:45 4421 12
原创 信贷风险控制管理-策略生成及规则挖掘
规则引擎使用一组简单的规则进行客户分类,使得不同客户群体的期望风险存在显著差异,并能够快速进行风险划分。公司领导发现只有给等级A的客户放款才能不亏钱,现需要我们在现在的基础上制定有效的规则策略,控制坏账率。业务背景:某打车平台和某些加油站达成合作,联合推出油品贷业务,可以给打车平台的司机提供贷款等业务,但最近发现使用油品贷的人,坏账率很高,数据高达5%,否则项目会被砍掉。该树的模型当中,设置三个参数,max_depth最大深度为3,min_samples_leaf表示在叶节点处需要的最小样本数为500,
2023-04-15 12:09:57 648 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人