![76c661e9-5528-eb11-8da9-e4434bdf6706.png](http://p04.5ceimg.com/content/76c661e9-5528-eb11-8da9-e4434bdf6706.png)
风控业务背景
大家耳熟能详的一些信用评分就是最终以这种形式呈现,例如:
- 芝麻分的分值范围为350~950,分值越高代表信用越好,相应违约率相对较低,较高的芝麻分可以帮助用户获得更高效、更优质的服务。(摘自:芝麻信用官网)
- FICO分的分值范围为300~850,分数越高, 说明客户的信用风险越小。
那么如何将逻辑回归概率分映射为这种整数形式的分数呢?本文将详细介绍2种常见的尺度变换(scaling)方法。
目录
Part 1. 逻辑回归评分卡建模流程简介
Part 2. 基于Points & Odds & PDO的尺度变换
Part 3. 基于Worst & Best Scores的尺度变换
Part 4. 总结
致谢
版权声明
参考资料
Part 1. 逻辑回归评分卡建模流程简介
在《风控模型开发流程标准化》中,我们详细介绍了信用评分建模流程。略去单变量筛选等步骤,逻辑回归评分卡的制作过程,主要包括:
- step 1. 变量WOE分箱映射
- step 2. 逻辑回归参数估计
- step 3. 概率分数尺度变换
1. 变量WOE分箱映射
![77c661e9-5528-eb11-8da9-e4434bdf6706.png](http://p01.5ceimg.com/content/77c661e9-5528-eb11-8da9-e4434bdf6706.png)
如图1所示,我们对某个单变量进行WOE变换,基本要求是保证WOE曲线保持单调性。但这并不是绝对的,若能从业务上解释不单调的原因也可以,例如:对于数据源未覆盖的样本都落入null分箱中。
式
经过WOE编码后,变量
![78c661e9-5528-eb11-8da9-e4434bdf6706.png](http://p04.5ceimg.com/content/78c661e9-5528-eb11-8da9-e4434bdf6706.png)
我们按此WOE编码逻辑,完成对原始变量映射转换处理。以变量
case when x1 < 0.02377 then 0.545
when x1 >= 0.02377 and x1 < 0.02535 then 0.346
when