auc到多少有意义_【干货速递】信贷风控中AUC/KS的理解

最新推荐文章于 2021-09-03 13:10:01 发布

住颜

最新推荐文章于 2021-09-03 13:10:01 发布

阅读量1.4k

点赞数

文章标签： auc到多少有意义

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_31596631/article/details/112410787

版权

本文深入探讨了AUC和KS在信贷风控领域的应用，解释了它们的定义、ROC曲线、以及样本逾期率和样本量对AUC/KS的影响。通过理论推导和数值模拟，阐述了AUC/KS与样本逾期率的关系，并指出样本量在1000以上时，抽样误差对AUC/KS的影响较小。

摘要由CSDN通过智能技术生成

作为风控从业人员，你真的足够了解AUC/KS吗？

AUC/KS是信贷领域使用极其高频的指标，常被用来评估二分类模型、分数类数据产品的区分能力。但在实际的业务中，发现很多业务人员甚至建模专家在使用AUC/KS时，仅仅关注AUC/KS值的大小而忽略例如样本逾期率、样本量等重要细节。

本文将用“硬核”的方式(理论推导与数值模拟)带你重新认识这两个明星指标，试图回答清楚如下三个问题：

AUC 与KS有互相决定关系吗？
样本逾期率是否会影响 AUC/KS 大小？
样本量是否会影响 AUC/KS 大小？

1

Part1：AUC/KS定义

在介绍AUC/KS的定义之前，我们先介绍一些基础的概念。

定义一：混淆矩阵(confusion matrix)

对于二分类问题(例如风控中的是否逾期、营销中的是否响应等)，结果总是可以归为如下四类：

上面这个表格我们一般称为‘混淆矩阵’，但绝对数量一般说明不了问题，实际中我们更加关注比率。

定义二：真阳率(tpr)与假阳率(fpr)

用一个具体的例子来介绍上述两个概念。假设我们一共有200个申请用户，好坏各100个。现在有一款分数类产品给每一个用户都打了一个0-100的信用评分。如果我们将信用分数大于80分就判定为“好人”否则为”坏人“。我们得到了如下的混淆矩阵：

套用公式我们计算出TPR = 90%与FPR = 30%。

Ps：什么情况下tpr与fpr会达到最大与最小？
如果好坏样本差别很大(例如真实的好人都是80分以上，坏人都是60分以下)，而且我们的这个划分规则也选的够好(例如选在了60-80之间)，那我们的判定就能完全正确，TP与TN恰好等于100，

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。