一个典型的个贷评分卡挖掘建模项目（4）

最新推荐文章于 2024-09-18 16:22:39 发布

数智化智者

最新推荐文章于 2024-09-18 16:22:39 发布

阅读量1.3k

点赞数 9

分类专栏：金融风险管理文章标签：创业创新职场和发展金融数学建模数据挖掘聚类回归

本文链接：https://blog.csdn.net/xushengyongat/article/details/136839437

版权

4.模型评估

4.1.模型区分能力评估

模型的风险区分能力在于它能够有效识别出好坏账户。具有最大区分能力的模型可以精确的预测出所有的坏账户。然而实际上这样的理性模型并不存在。一般称一个模型具有较高的风险区分能力是指评级分值较高的客户群在未来仅包含很低比例的坏客户和很高比例的好客户，较低的风险区分能力模型正好相反。模型区分能力一般的统计测度包括AR值、K-S变量。

4.1.1.Accuracy Ratios（AR）

累积准确曲线（CAP）及其主要指数准确性比率（AR）主要用来检验模型对客户进行正确排序的能力。CAP曲线及准确性比率/AR描绘了每个可能的点上累计违约排除百分比。为了画出CAP曲线，需要首先自高风险至低风险排列模型的分数，然后对于横坐标客户总数中特定的比例，CAP曲线的纵坐标描述风险评级分数小于或等于横坐标x中的违约个数百分比。一个有效的模型应当在样本客户处于同一排除率的情况下，排除更高百分比的坏客户。

下图为CAP曲线示意图：

CAP曲线描述了各个评分结果下，累积违约客户比率和累积正常客户的关系。曲线上的点，例如（0.2，0.7），表示评级风险较高的20%的评级对象占违约客户的70%。在完美的模型下，CAP曲线开始阶段呈线性增长（斜率为１/违约率），然后稳定在１的水平上。反之，在完全没有区别能力下，模型的CAP曲线会是一条45度的直线。而AR（准确率，Gini系数）的定义为模型的CAP曲线和45度线间的区域面积，与介于45度线和完美模型的区域面积的比率，如下所示：

这个值越接近1，表示模型的效果越好。

下表为AR值对应的模型区分能力：

AR值	模型表现
<0.3	差
0.3-0.5	一般
0.5-0.6	好
0.6-0.7	很好
0.7-0.8	非常好
0.8-1	完美

利用时间内验证样本和时间外验证样本对模型的区分能力进行检验，发现AR值在0.37到0.40之间,模型较稳定，且具有一定的区分能力，具体见下表：

AR值		模型表现
开发样本		0.408373
验证样本		0.40081
时间外验证样本(2月)		0.378526
时间外验证样本(3月)		0.390023
剔除开发样本中重复的坏账户	时间外验证样本(3月)	0.370199
	时间外验证样本(4月)	0.376906