一文完全理解模型ks指标含义并画出ks曲线（包含代码和详细解释）

最新推荐文章于 2025-03-16 10:57:58 发布

scxyz_

最新推荐文章于 2025-03-16 10:57:58 发布

阅读量7.8w

点赞数 43

分类专栏：大数据风控文章标签： ks auc 风控模型区分度 ks指标

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sscc_learning/article/details/86707005

版权

本文详细介绍了KS指标的计算过程、ks曲线的绘制以及使用sklearn的roc_curve函数。KS指标用于评估模型风险区分能力，值越大表明模型区分好坏样本的能力越强。文中提供两种计算方法，包括手动实现和使用库函数，并通过实例解释了每个步骤和参数含义。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

KS(Kolmogorov-Smirnov)：KS用于模型风险区分能力进行评估，指标衡量的是好坏样本累计分部之间的差值。
好坏样本累计差异越大，KS指标越大，那么模型的风险区分能力越强。

$max(\frac{Cum. B_i}{Bad_{total}} - \frac{Cum.G_i}{Good_{total}})$

上面是ks的简单介绍，相信大家看了这几句话和一个公式，肯定还是不懂ks到底是个什么。我也是研究了一下，终于搞清楚了ks的具体计算方式。搞清楚了计算方式后，ks的含义自然就清楚了。
下面我会详细讲解实现方法，相信如果你看完本文章，肯定可以理解ks。以下内容均为个人纯手打，难免有些疏漏，如有错误，请大家指出。

本文会介绍两种计算ks的方法：
第一种是我自己手动写代码实现的，可以帮助你理解ks含义；
第二种是sklearn模块里面的roc_curve函数计算，通过第一种方法理解了ks后，实际应用中使用第二种方法，更方便。

ks的计算流程

话不多说，先看代码，后面会解释代码，顺便解释清楚ks含义。

import numpy as np
import pandas as pd


def ks(df, y_true, y_pre, num=10, good=0<

最低0.47元/天解锁文章

评论 13

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。