依发展母体区分
- 通用性评分
- 征信机构评分
- 客制化评分
依使用时机区分
- 进件评分
- 行为评分
- 催收评分
评分模型开发
- 确定评分目的
- 建模指标的基本定义
- 资料准备
- 变量分析
变量的形态分为连续变量和间断变量;
单因子分析,将变量分组,分组原则为组间差异大,组内差异小。分组占率不低于5%,各组必须同时拥有好坏客户。
WOE迹象全数,ln(正常件占比/违约件占比),违约件占比高时WOE为负数,WOE绝对值越大表示好坏用户区分程度越高。
IV信息值,(正常件占比-违约件占比)* WOE。
信息值 | 解释能力 |
<0.03 | 无预测能力 |
0.03~0.09 | 低 |
0.10~0.29 | 中 |
0.30~0.49 | 高 |
>=0.50 | 极高 |
为了提高信息值,需要合并WOE相近的组别。然后将长清单变量经过排除高度相关、趋势异常等操作变为短清单变量集合。
5.建立模型
样本不均衡采用采样的方式控制好坏比率在3:1~5:1,通过交叉验证,用逻辑回归建模。
6.婉拒推论
建模时仅使用核准案件而把婉拒案件排除在外,会造成模型偏误,无法观察其实际绩效表现,也无从得知哪些案件遭到误判,因此需要根据婉拒推论推测婉拒案件的好坏,以进行模型修正,使未来模型的预测更接近真实情况。
单纯扩充法、分群法
7.效力验证
样本外验证、时间外验证
a.区隔力指标
K-S value | 解释能力 |
<0.20 | 无 |
0.21~0.40 | 低 |
0.41~0.50 | 中 |
0.51~0.60 | 高 |
0.61~0.75 | 极高 |
>0.9 | 太高,可能有问题 |
基尼系数 | 解释能力 |
0 | 无 |
0~0.4 | 低 |
0.4~0.6 | 中 |
0.6~0.8 | 高 |
>0.8 | 极高 |
b.稳定度指标
PSI | 模型稳定度 |
>0.25 | 低 |
0.1~0.25 | 中 |
<0.1 | 高 |
参考书籍《互联网金融时代消费信贷评分建模与应用》