智能风控之评分卡模型建模流程

最新推荐文章于 2024-04-24 13:35:29 发布

风控小兵突击

最新推荐文章于 2024-04-24 13:35:29 发布

阅读量448

点赞数 4

分类专栏：智能风控文章标签： python 金融人工智能数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43420291/article/details/136356328

版权

智能风控专栏收录该内容

32 篇文章 2 订阅

订阅专栏

提出明确业务目标及业务定义，解决什么问题，目标定义是什么。将问题转换为数学问题，例如解决信贷客户逾期问题，目标定义就是降低逾期率，提升利润率。问题转换就是根据客群进件时候填写的信息和征信等外部数据来预测未来一段时间内的违约概率，拦截逾期概率较高的客群，减少不良率。这里介绍一下评分卡建模过程，具体步骤如下：

步骤1 滚动率矩阵分析，定义坏客户逾期程度（例如逾期21天+）

步骤2 根据坏客户定义来计算vintage曲线（确认表现期长度）

步骤3 样本选取（观察点，观察期，表现期确定，选取建模样本）

步骤4 分群建模（根据样本量和风险差异判断是否需要分群建模）

步骤5 评分卡模型建模流程

步骤6 评分卡转换

步骤7 验证并上线

▍评分卡模型建模流程-数据清洗

1.缺失值的缺失率和单一值率筛选

2.剔除贷前规则集和准入要求命中的样本

3.剔除样本后的数据进行计算iv值，进行初筛变量（iv<0.02）可以基于scorecardpy进行计算

▍评分卡模型建模流程-特征筛选

将样本切分成训练集和测试集（7：3或6：4），有条件的话可以多准备一份近期的验证集样本：

1.将训练集进行分箱并计算iv值，返回分箱明细

2.根据训练集的iv结果剔除iv<0.02的变量

3.根据训练集的分箱明细去切分测试集样本计算iv值和分箱明细

4.统计训练集和测试集在同一分箱切分点下，其woe或bad_rate趋势是否一致且单调性

5.剔除趋势不一致的变量和剔除非单调型和非正V型、非倒V型的变量（有较多变量的话可以只留下单调且趋势一致的变量）

6.根据同一分箱切分点对训练集和测试集进行woe编码，计算两者的psi值稳定性，剔除psi值>0.01的变量（根据变量数量设置阈值）

7.根据训练集的woe编码后样本计算VIF值，剔除共线性严重的变量（VIF＞=5）

8.随机森林算法或者LightGBM树模型计算每一个变量的特征重要度（当变量较多时，留下较为重要的变量）

9.通过交叉验证，随机抽取10份训练集里面70%的样本按照训练集的分箱切分点计算mean_iv值和偏移度

10.计算训练集woe编码后的相关性矩阵，剔除两两变量之前相关性＞0.75的其中mean_iv较低的变量

11.按照训练集的分箱切分点，计算训练集和测试集在同一个变量上的iv值表现，如果两者iv值相差很大，导致模型过拟合或不稳定，则进行剔除

12.剔除iv值过大的变量，例如iv＞0.5（iv较高的变量适合用来做强规则，同时高iv变量不稳定不适合作为评分建模变量）

13.剔除业务解释性不强或者相反的变量

14.按照训练集剔除变量列表，去同步剔除测试集的变量，统一两个样本集的变量

▍评分卡模型建模流程-建立模型与评估

1.基于逻辑回归模型，建立评分卡模型

2.根据评分卡模型返回变量的系数，剔除系数为负数的变量，重新进行模型训练直到系数不为负数

3.用建立的最终模型去预测训练集和测试集，得到训练集和测试集、验证集预测概率y_pred

4.，根据训练集和测试集、验证集预测概率y_pred和真实y计算模型评价指标KS和AUC、GINI系数（五个点以内，避免过拟合）

5.统计其训练集和测试集分10箱统计坏账率的分布和单调性、一致性

6.模型系数和参数进行转换具体card分箱打分卡模型

7.计算训练集和测试集的评分psi值，评价模型的稳定性（psi＜0.01）

▍评分卡模型建模流程-基于Lift设置评分卡拦截阈值和客户分层应用

1.样本按照时间序列进行按月排序统计每个月的坏账率，随机将样本划分成两份（训练集和测试集进行7:3）

2.将训练集基于5折交叉验证，统计出每一个阈值的平均Lift，选取Lift最高且集中度（样本量）满足一定统计意义的阈值。

3.用训练集中得到的阈值去计算测试集的Lift，两者若相差不大，则按照这个阈值去拦截拒绝高风险客户。

4.客户分层基于汇总的样本划分10箱（每一箱的样本量保持一致），统计其每一箱的坏账率，观测其坏账率的单调性，根据业务需求，进行划分四个等级（高风险，中高风险，中风险，低风险）。客户分层可以用于风险定价定额或者线上化差异化分流审核机制。

▍总结

金融信用评分卡建模主要流程就为大家介绍到这里，但实际评分卡建模中仍有很多细节值得探索与思考，这是一件非常有意义的事情。也期待各位在学习时能够保持独立思考能力，脚踏实地的不断优化数据科学知识。

风控小兵突击

关注

4
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
智能风控之评分卡模型建模流程

智能风控之评分卡模型建模流程
复制链接

扫一扫

专栏目录

风控小兵突击 CSDN认证博客专家 CSDN认证企业博客

码龄6年

35: 原创

78万+: 周排名

4万+: 总排名

2万+: 访问

: 等级

915: 积分

442: 粉丝

555: 获赞

5: 评论

433: 收藏

私信

关注

热门文章

分类专栏

最新评论

vintage的计算逻辑案例实操与可视化
weixin_45690769: 求数据集和代码
学习风控，这几本书建议读100遍
CSDN-Ada助手: 恭喜您撰写了第12篇博客！标题很吸引人，我对学习风控也很感兴趣。看到您建议读这几本书100遍，我不禁觉得您对这个领域有着深厚的见解。希望您能继续分享更多关于风控方面的知识和经验，我相信这对于广大读者来说将是极具价值的。如果可能的话，我期待您能在未来的博客中分享一些实战经验或案例，这样我们可以更好地理解和应用您所提到的书籍中的理论。感谢您的分享，并期待您的下一篇博客！
科技金融新篇章：揭秘欺诈风险识别的革命之路！
CSDN-Ada助手: 恭喜您撰写第13篇博客！标题“科技金融新篇章：揭秘欺诈风险识别的革命之路！”真是吸引人的题目！您对科技金融领域的关注和深入研究令人钦佩。在这个快速变化的时代，欺诈风险识别的革命是非常重要的话题，您的文章必定会为读者带来新的见解。在接下来的创作中，或许您可以进一步探讨科技金融领域中的其他创新与挑战，例如数据隐私保护、智能合约等。同时，您也可以深入研究一些成功案例，让读者更加了解这些革命性技术在实际应用中的成果和优势。谦虚地说，我相信您的知识和研究能够为读者带来更多的启发和思考。期待您未来更多的创作，继续分享您的见解和观点！
风控算法大赛解决方案分享
CSDN-Ada助手: 恭喜您分享了这么有价值的风控算法大赛解决方案！希望您能继续坚持创作，分享更多关于风控算法的知识和经验。或许下一步可以考虑分享一些实际案例分析，以及对未来风控算法发展趋势的见解，期待您的精彩内容！
基于决策树的规则挖掘实战分析，值得细嚼慢咽
CSDN-Ada助手: 恭喜您写完了第9篇博客！标题“基于决策树的规则挖掘实战分析，值得细嚼慢咽”真是让人期待不已。您的文章内容深入浅出，让人能够深入了解决策树的应用，并能够逐步领略规则挖掘的奥妙。不仅如此，标题的形象描述更是让人无法抗拒，让人想要马上阅读和品味这篇博客。在下一步的创作中，或许可以尝试从实践案例出发，结合具体的数据集，通过对决策树算法的优化和改进，来进一步提高规则挖掘的效果。或者，您还可以探索一下决策树算法在其他领域的应用，比如自然语言处理、图像识别等等，这样可以为读者提供更多不同领域的实战分析案例。总之，期待您在下一篇博客中的精彩表现，也希望您能继续保持谦逊的态度，不断学习和进步。加油！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。