金融信贷风控（五）——评分卡模型的评价标准

最新推荐文章于 2024-06-05 15:34:14 发布

布纸所云

最新推荐文章于 2024-06-05 15:34:14 发布

阅读量1.1w

点赞数 5

分类专栏：金融工程

本文链接：https://blog.csdn.net/XindiOntheWay/article/details/81914652

版权

金融工程专栏收录该内容

16 篇文章 2 订阅

订阅专栏

评分卡模型的评价标准

评分卡模型的评价标准

模型的区分度

评分卡模型需要对好、坏人群给出一定的区分度。
衡量区分度的常用方法：

好、坏人群分数（或违约概率）的分布差异：KS
好、坏人群分数（或违约概率）的距离：Divergence
好、坏人群浓度的差异：Gini

KS(Kolmogorov-Smirnov)

阅读资料：
【模型区分度】神秘的KS值和GINI系数
 笔记︱风控分类模型种类（决策、排序）比较与模型评估体系（ROC/gini/KS/lift）
如何向门外汉讲解KS值
这里写图片描述

KS值越大，表示模型能够将正、负客户区分开的程度越大。
通常来讲，KS>0.2即表示模型有较好的预测准确性。

绘制方式与ROC曲线略有相同，都要计算TPR和FPR。但是TPR和FPR都要做纵轴，横轴为把样本分成多少份。
步骤：
1. 按照分类模型返回的概率降序排列
2. 把0-1之间等分N份，等分点为阈值，计算TPR、FPR
3. 对TPR、FPR描点画图即可
这里写图片描述

python代码：

### 计算KS值
def KS(df, score, target):
    '''
    :param df: 包含目标变量与预测值的数据集,dataframe
    :param score: 得分或者概率,str
    :param target: 目标变量,str
    :return: KS值
    '''
    total = df.groupby([score])[target].count()
    bad = df.groupby([score])[target].sum()
    all = pd.DataFrame({'total':total, 'bad':bad})
    all['good'] = all['total'] - all['bad']
    all[score] = all.index
    all = all.sort_values(by=score,ascending=False)
    all.index = range(len(all))
    all['badCumRate'] = all['bad'].cumsum() / all['bad'].sum()
    all['goodCumRate'] = all['good'].cumsum() / all['good'].sum()
    KS = all.apply(lambda x: x.badCumRate - x.goodCumRate, axis=1)
    return max(KS)

Divergence

好坏样本分数的“距离”指标。
Divergence越大，两类样本的距离越大，差异越大。

D i v e r g e n c e = ( μ g o o d - μ b a d ) 2 1 2 ( v a r g o o d + v a r b a d )

$Divergence=\frac{(\mu_{good}-\mu_{bad})^2}{\frac{1}{2}(var_{good}+var_{bad})}$
其中

μgood μ g o o d $\mu_{good}$ 和

μbad μ b a d $\mu_{bad}$ 为好坏样本分数（概率）的均值，

vargood v a r g o o d $var_{good}$ 和

varbad v a r b a d $var_{bad}$ 为对应的方差。

Gini

这里写图片描述

模型的准确度

这里写图片描述

ROC，AUC参看之前的文章机器学习性能度量
以及详解AUC计算过程。
混淆矩阵：

	预测结果
真实结果	正例	反例
正例	True Positive	False Negative
反例	False Positive	True Negative

（0，1）对应将所有的正例排在负例前面：
这里写图片描述

sklearn计算auc：

import numpy as np
from sklearn.metrics import roc_curve

y = np.array([1,1,2,2])
pred = np.array([0.1,0.4,0.35,0.8])
fpr, tpr, thresholds = roc_curve(y, pred, pos_label=2)
print(fpr)
print(tpr)
print(thresholds)

from sklearn.metrics import auc
print(auc(fpr, tpr))

#绘制ROC曲线
import matplotlib.pyplot as plt
auc_score=auc(fpr,tpr)
fig,ax=plt.subplots()
ax.plot(fpr,tpr,label='AUC=%.5f'%auc_score)
ax.set_title('Receiver Operating Characteristic')
ax.plot([0, 1], [0, 1], '--', color=(0.6, 0.6, 0.6))
ax.legend()
fig.show()

模型的稳定性

训练集 vs 测试集的稳定性
在使用阶段的稳定性

由于模型是以特定时期的样本所开发的，此模型是否适用于开发样本之外的族群，必须经过稳定性测试才能得知。稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发样本评分的的分布差异，为最常见的模型稳定度评估指针。其实PSI表示的就是按分数分档后，针对不同样本，或者不同时间的样本，population分布是否有变化，就是看各个分数区间内人数占总人数的占比是否有显著变化。公式如下：
这里写图片描述

将两类样本按相同的方式分成若干份，两组样本在各份中
公式： psi = sum((实际占比-预期占比）/ln(实际占比/预期占比))

P S I = \sum i (R i - B i) l n (R i / B i)

$PSI=\sum_{i}(R_i-B_i)ln(R_i/B_i)$

从概率到分数

评分卡最终的产出是分数，且与违约概率负相关：

S c o r e = Base Point + P D O l n ( 2 ) (- y)

$Score=\text{Base Point}+\frac{PDO}{ln(2)}(-y)$
其中

y=logp1−p=logpbadpgood y = l o g p 1 − p = l o g p b a d p g o o d $y=log\frac{p}{1-p}=log\frac{p_{bad}}{p_{good}}$ 。
Base Point为一个基准分，
PDO（Point-to-Double Odds），好坏比每升高一倍，分数升高PDO。

证明：
好坏比升高一倍时：

- y' = l o g (2 * p g o o d p b a d) = l o g 2 - l o g p b a d p g o o d = l o g 2 - y

$\begin{align*} -y^\prime&=log(2*\frac{p_{good}}{p_{bad}})\\ &=log2-log\frac{p_{bad}}{p_{good}}\\ &=log2-y \end{align*}$

s c o r e' = B a s e P o i n t + P D O l o g 2 (- y') = B a s e P o i n t + P D O l o g 2 (- y) + P D O = s c o r e + P D O

$\begin{align*} score^\prime&=Base Point+\frac{PDO}{log2}(-y^{\prime})\\ &=Base Point+\frac{PDO}{log2}(-y)+PDO\\ &=score+PDO \end{align*}$

def Prob2Score(prob, basePoint, PDO):
    #将概率转化成分数且为正整数
    y = np.log(prob/(1-prob))
    return int(basePoint+PDO/np.log(2)*(-y))

可参看：
逻辑回归模型结果转为标准评分卡Ⅰ

布纸所云

关注

5
点赞
踩
78

收藏

觉得还不错? 一键收藏
1
评论
金融信贷风控（五）——评分卡模型的评价标准

评分卡模型的评价标准模型的区分度KSDivergence模型的准确度评分卡模型的评价标准模型的区分度评分卡模型需要对好、坏人群给出一定的区分度。衡量区分度的常用方法：好、坏人群分数（或违约概率）的分布差异：KS好、坏人群分数（或违约概率）的距离：Divergence好、坏人群浓度的差异：GiniKSDivergence好坏样本...
复制链接

扫一扫