标准评分卡分数计算原理_学习评分卡Gini指标？这篇看完就够了！

最新推荐文章于 2023-04-23 22:06:51 发布

星落樱耀

最新推荐文章于 2023-04-23 22:06:51 发布

阅读量2.1k

点赞数 1

文章标签：标准评分卡分数计算原理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42470359/article/details/112771464

版权

本文深入探讨了评分模型中的Gini系数，作为衡量模型区分能力的指标，Gini系数在金融评分卡中起到关键作用。介绍了Gini的计算公式，并指出其在目标变量定义上的敏感性。根据行业经验，给出了不同Gini值对应的模型区分能力评价。同时，提供了SAS计算Gini的方法，并提示Python和R用户自定义计算过程。

摘要由CSDN通过智能技术生成

一：模型分数效用指标

对于训练出来的Score Model，需要一系列指标对Model进行关于稳定性、区分能力等效用来度量。

2. GINI（基尼系数）

KS指标理解起来很方便，运用场景也非常多，但大家对于Gini这个指标经常是一知半解。

Gini系数是国际上通用的，用以衡量一个国家或地区居民收入差距的常用指标，所以，运用在评分模型中它也是表征评分模型的区分能力。

Gini的计算公式（虽然我知道没几个人愿意看这个破公式，但我还是愿意贴出来，用以提醒这个Gini和基尼不纯度的本质区别）

cpY是收入排序后的累计比例，cpX是人口的累积比例，其结果是一个秩相关系数，很多统计软件包比如SAS提供的Some’s D其实就是Gini系数。

在评分卡中，可以看下面表来理解下Gini的计算过程

其中，G_num代表好客户数量，B_num代表坏客户数量，Retain代表累积。

虽然Gini指标与Ks一样也是金融评分模型界通用的核心指标，但是它的使用也是有一些需要注意的地方：

1) 评估评分卡的区分能力时，如果坏客户的定义不是那么严格，Gini系数对应代表的区分能力可能被夸大效果；

2) Gini对目标变量类别的定义比较敏感，比如账户的好坏。

所以要想Gini指标精确有效，那么目标变量Y的定义在评分卡开发初期是十分重要和严谨的步骤。

Gini系数的不同范围值对应的评分模型区分能力高低也不一样，行业内也没有一个绝对标准，小编经验认为：

针对评分卡集来说，申请评分卡集的通识标准：

1) Gini<0.3,模型不太能接受；

2) 0.3<=Gini<0.35,模型区分能力一般，模型有优化空间；

3) 0.35<=Gini<=0.5,模型区分能力比较满意；

4) Gini>0.5，Gini越高越有过拟的可能性；

行为评分卡集的通史标准：

1) Gini可能会超过0.8；

2) Gini<0.6，可能模型有问题。

当然了，对于单一评分卡模型的话，Gini的接受浮动就比较大了，比如某一特定场景开发出的申请评分卡，因为IV高于0.1的变量本身就很少了，这个时候的Gini标准就不再需要采用通识标准了。

SAS软件代码可以直接用SMDRC调出Gini结果，Python和R大家要按照公式写一下计算过程哦！

微信公众号搜索：「金科应用研院」
可以从菜单栏点击「在线学习」
更多风控资讯与干货学习资料，都在微信公众号

回复关键字： 「风控量化福利包」➡️领取干货学习资料
回复任意词可以加我们官方微信加入风控学习群
不定期分享干货PPT，一起讨论风控经验～

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。