从业务视角理解评分卡分数映射

最新推荐文章于 2024-08-18 18:03:33 发布

金科应用研院

最新推荐文章于 2024-08-18 18:03:33 发布

阅读量892

点赞数 9

分类专栏：监控模型文章标签：金融大数据 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bianti/article/details/136866073

版权

监控模型专栏收录该内容

3 篇文章 0 订阅

订阅专栏

本文探讨了信用风控中的评分卡模型和机器学习模型如何转化为用户可理解的信用分数，通过实例分析了小作坊和精细化模式下的模型应用，以及如何根据不同用户群体设置不同的盈亏平衡点和利率策略。

摘要由CSDN通过智能技术生成

目前在个人信用风控建模领域常见的模型有两种：

1）基于线性回归分析的评分卡模型，常见于银行背景的放贷机构；

2）基于大数据的机器学习模型，如随机森林、XGBoost等，常见于互联网金融领域。

这两种建模方法无论哪种都需要将模型结果映射到信用分数空间，最终呈现给用户一个能够表征信用的分数，比如国内的芝麻分，美国的FICO分。

那么问题来了，模型结果和分数同样都是数值，为什么不直接呈现模型结果？为什么还要进一步转化为分数？

要搞懂这个问题，就需要深入到业务中，结合业务背景去理解分数的意义和模型结果映射到分数的内在逻辑。

下面我们就从简单到复杂，一步步拆解给出不同业务下的模型使用和分数映射方法。

01、小作坊模式 —— 一款产品一个模型

先从最简单的情况入手，假设我们现在成立了一家小信贷公司，推出一款借贷产品，详情如下：

在这里插入图片描述

此时摆在我们面前的第一个问题就是：如何让这款产品盈利？

也就是说要把钱借给信用好的用户，能够按时还款的用户，这样才能保证产品能够盈利。在信贷领域通常逾期超过30天的用户基本上就不会再还钱了，自然的我们就可以通过逾期率来衡量用户的好坏程度。

逾期率多少是可以忍受的？

按照这个公式计算出逾期率的盈亏平衡点：

在这里插入图片描述

其中：

pd——逾期概率（Probability of Default）

将产品详情数值代入公式后计算得到pd30=1.5%，即盈亏平衡点。

如何确定模型预测结果阈值？

这里我们看一看真实的模型打分结果长什么样子，这里用的是XGBoost模型：

在这里插入图片描述

其中：label——0表示正常还款，1表示逾期。predict——模型预测结果

逾期率和模型结果的值域都是[0,1]，那么“模型预测结果==实际逾期概率”这个假设成立吗？

我们做一个简单的统计，从均值、分位点的结果上看他们并不能直接划等号。

注：理论上来说LR的输出概率可以认为是真实概率，而其他分类器的输出概率并不反映真实概率。

在这里插入图片描述

接下来我们需要将模型预测结果先排序，再分桶计算各个桶的逾期率，找到满足盈亏平衡点要求的预测结果阈值，低于阈值（用cutoff表示）通过贷款申请，反之则拒绝贷款申请。

在这里插入图片描述

至此，你的小作坊将面临几种选择：

1.直接告诉用户贷款申请结果呢？通过或拒绝

这样做不是不可以，但给用户的感觉有点霸道了（是不是很像申请信用卡的感觉，等了半个月被通知审核失败），这不是一个互金小作坊该有的服务态度。

这样做也不是不可以，但设身处地的站在用户角度想一想会怎样？

用户该想了这个小数点后这么多位的数值到底是个啥？高了好还是低了好？从小到大我只见过1星到5星，0分到100分。。。。

通常真实数据的逾期率差别在小数点2位以后，显然把逾期率反馈给用户是不够专业的，这还没考虑是不是暴露了商业机密的问题。

3.把模型预测值映射到一个分数区间，比如350～950，分数越高信用越好。

很自然的我们就走到了这个最佳选择，至于分数为什么定义在这个区间，我个人理解一为是为了跟国际上主流的个人信用评分区间接轨；二是为了拉开用户之间的分数差距。

如何映射分数？

我们先假设用尺度变化的方法将模型预测结果线性的映射到350～950，然后找到cutoff对应的分数X，告诉用户分数高于X就可以拿到贷款。

等一下！如果过段时间模型更换了怎么办，模型换了cutoff也就变了，分数X也跟着变了。这时就会有一部分用户疯狂的打电话给你的客服问为啥我的评分变高了，还不让我贷款？

于是你赶紧召集小作坊成员讨论解决方案，有人提出一个又简单又好用的方案：分段尺度变换，就是将cutoff固定为680分（假设是这个分数）然后分成两段作尺度变换。

大家一讨论，方案可行：

1、无论模型预测结果的cutoff如何调整，用户感知不到差别，只要分数超过680都可以成功申请到贷款；

2、解耦了模型部门和后台开发部门的工作，也就是说当模型人员校准好评分后，后台开发只需要设定680分通过，从此以后无论模型人员怎么更换模型，后台开发都不用再重新修改代码。

分数映射：0, 0.02999, 1 -> 350, 680, 950

在这里插入图片描述

从此，小作坊的客服电话终于安静了。

随着业务的发展，你开始思考如何扩大利润，现有的业务模式是否存在不合理的地方，业务逐渐向精细化的方向发展。

02、精细化模式 —— 区分新老客户（A卡、B卡）

敏锐的你发现，随着用户的复贷次数增多，原有盈亏平衡点的计算方式会使得拉新成本被计算了多次（用户复贷几次就多计算几次）。这也就引出了将用户区分成新老客户，分别建模，分别计算盈亏平衡点。

传统的评分卡也是将其拆分成A卡B卡：

A卡是使用最广泛的，用于贷前审批阶段对借款申请人的量化评估；

B卡的主要任务是通过借款人的还款及交易行为，结合其他维度的数据预测借款人未来的还款能力和意愿；

综合分析这样做的优点有：

1.新老客户的建模特征不同，老客户可以引入历史还款行为的特征，使得模型更准确。

2.拉新成本属于边际成本，也就是说当新用户转化为老用户后，每多一次复贷都会将拉新成本摊平。那么就可以将拉新成本算在新用户上，老用户的成本降低，对逾期率有更大的容忍度；

3.修正老客户的盈亏平衡点，可以提高老客户的通过率，从而提高复贷率，提高盈利。

那么我们再重新计算以下老用户的盈亏平衡点：

在这里插入图片描述
带入公式计算得到盈亏平衡点pd = 0.0217

同理采用分段尺度变换方法可以将模型结果进一步映射到信用分数空间，这里不再赘述。

此时此刻你又开始思考如何做大做强，为了吸引更多用户，留住优质客源，你跑断了腿找到一个新的资本方，愿意以更低的资金成本给你提供资金来源，于是你终于可以上线一款新产品：更低的利率给更好的你。

用户质量分层，匹配不同利率产品

将老用户分为优质用户和次优用户，为优质用户匹配低利率的产品（或额度更高的产品）

按照这个思路就可以将用户分为以下四个层次：

A – 老用户中的优质用户资金成本0.02 利率0.22 额度5000

B – 老用户中的次优用户资金成本0.04 利率0.34 额度3000

C – 新用户中的优质用户资金成本0.02 利率0.30 额度3000

D – 新用户中的次优用户资金成本0.04 利率0.34 额度1000

只以A、B类用户举例，同理带入公式计算盈亏平衡点：

A类用户盈亏平衡点pd = 0.01467

B类用户盈亏平衡点pd = 0.0216

这样的ABCD四类用户评级结果可以直接反馈给用户，也可以将尺度变换划分出更多分段，比如分数高于780可以申请低利率贷款。（代码可以参考分段尺度变换，增加判断分支）

随之而来的问题也就出现了，当产品越来越丰富，变换额度变换利率，需要计算的盈亏平衡点越来越多，再使用分段尺度变换这种简单粗暴的方法就显得越来越笨拙了。

以上，就是对于业务视角下理解评分卡数分映射的总结，希望可以帮助读者朋友们。

金科应用研院

关注

9
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
从业务视角理解评分卡分数映射

目前在个人信用风控建模领域常见的模型有两种：1）基于线性回归分析的评分卡模型，常见于银行背景的放贷机构；2）基于大数据的机器学习模型，如随机森林、XGBoost等，常见于互联网金融领域。这两种建模方法无论哪种都需要将模型结果映射到信用分数空间，最终呈现给用户一个能够表征信用的分数，比如国内的芝麻分，美国的FICO分。那么问题来了，模型结果和分数同样都是数值，为什么不直接呈现模型结果？为什么还要进一步转化为分数？
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。