评分卡模型,用odds来校准概率(我的理解)

前言

评分卡模型建立时,样本的好坏比和实际好坏比是不一致的,原因有二:

1、产品本身坏样本少,抽样时会对坏样本进行过抽样或者好样本进行欠抽样

2、未获取全量的原始数据,样本中的好坏比无法反映真实的情况

评分卡模型预测的是坏样本的概率,好坏比使用的是坏样本量/好样本量

概率校准

1、需要一个目标好坏比odds1

它可以是抽样前的产品真实好坏比(对应情况1),也可以是行业平均水平(对应情况2)

2、建模样本好坏比odds

在sigmoid函数转换前,只需要在逻辑回归拟合出来的截距上再加一个ln(odds1/odds)即可,原因:逻辑回归中的截距是约等于好坏比的对数的,即:把ln(odds)抵消掉,得到实际好坏比ln(odds1)

ln(odds1/odds) = ln(odds1)-ln(odds)

3、校准分数段的好坏比

对好坏比进行一个sigmoid的反函数,加上ln(odds1/odds),再用sigmoid函数运算回来

案例

继续使用上篇的数据

评分卡模型阈值表(接上篇)-CSDN博客

 分组名称本组客户本组好客户本组坏客户好坏比(odds)坏样本占比
0[300-320)154112.7573.33%
1[320-340)163401233.0875.46%
2[340-360)257971601.6562.26%
3[360-380)3241172071.7763.89%
4[380-400)3571631941.1954.34%
5[400-420)3741602141.3457.22%
6[420-440)5332283051.3457.22%
7[440-460)11245855390.9247.95%
8[460-480)9324954370.8846.89%
9[480-500)7254352900.6740.00%
10[500-520)205112637880.6238.42%
11[520-540)148610224640.4531.22%
12[540-560)245417826720.3827.38%
13[560-580)250719515560.2822.18%
14[580-600)223818244140.2318.50%
15[600-620)725263958570.1311.82%
16[620-640)723165466850.109.47%
17[640-660)841777536640.097.89%
18[660-680)991993365830.065.88%
19[680-700)10473100444290.044.10%
20[700-720)14987145434440.032.96%
21[720-740)15149148652840.021.87%
22[740-760)19626193742520.011.28%
23[760-780)18659184841750.010.94%
24[780-800)1097010901690.010.63%
25[800-820)1094210885570.010.52%
总和14916513929298730.076.62%

指定实际上该产品的违约率 : 2% 。(假设) 
要还原真实的数据,需进行校准:
计算公式如下:
A=ln(odds)
B=A+ln(odds1/odds)=A -1.24505
C=1/(1+exp(-B))

分组名称好坏比(odds)ln(odds)(A)ln(odds)_adjust(B)bad_rate(C)
[300-320)2.751.0116-0.233544.19%
[320-340)3.081.1233-0.121746.96%
[340-360)1.650.5005-0.744632.20%
[360-380)1.770.5705-0.674533.75%
[380-400)1.190.1741-1.070925.52%
[400-420)1.340.2908-0.954227.80%
[420-440)1.340.2910-0.954127.81%
[440-460)0.92-0.0819-1.326920.97%
[460-480)0.88-0.1246-1.369720.27%
[480-500)0.67-0.4055-1.650516.10%
[500-520)0.62-0.4717-1.716815.23%
[520-540)0.45-0.7896-2.034711.56%
[540-560)0.38-0.9752-2.22039.79%
[560-580)0.28-1.2553-2.50047.58%
[580-600)0.23-1.4829-2.72806.13%
[600-620)0.13-2.0098-3.25493.72%
[620-640)0.10-2.2572-3.50222.92%
[640-660)0.09-2.4576-3.70262.41%
[660-680)0.06-2.7734-4.01851.77%
[680-700)0.04-3.1533-4.39831.21%
[700-720)0.03-3.4890-4.73410.87%
[720-740)0.02-3.9578-5.20280.55%
[740-760)0.01-4.3423-5.58730.37%
[760-780)0.01-4.6599-5.90490.27%
[780-800)0.01-5.0625-6.30760.18%
[800-820)0.01-5.2521-6.49710.15%
总和0.07-2.6468-3.89182.00%
 取值备注
实际好坏比(odds1)0.02041用2%算的
样本好坏比(odds)0.07088 
ln(odds1/odds)-1.24505 

C列就是各分数段预测出来的真实水平的违约概率啦~

  • 20
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值