如何评估分类模型的好坏

最新推荐文章于 2024-08-29 12:09:23 发布

211统计课堂2

最新推荐文章于 2024-08-29 12:09:23 发布

阅读量198

点赞数

文章标签：分类人工智能数据挖掘

原文链接：https://blog.csdn.net/m0_72494332/article/details/132472764

版权

如何评估分类模型的好坏

评估分类预测模型的质量，常用一个矩阵、三条曲线和六个指标。

一个矩阵：混淆矩阵；
三条曲线：ROC曲线、PR曲线、KS曲线；
六个指标：正确率Acc、查全率R、查准率P、F值、AUC、BEP值、KS值。

ROC曲线和AUC值

ROC曲线

ROC曲线（Receiver Operating Characteristic curve），即接收者操作特征曲线，是反映TPR和FPR的综合指标。

TPR = TP/(TP+FN)，即正类中正确预测的百分比（查全率）。

FPR = FP/(FP+TN)，即负类中错误预测的百分比（相当于误判率）。

ROC曲线是由点（TPR，FPR）组成的曲线，横坐标是FPR，而纵坐标是TPR。

显然，ROC曲线应该越靠近左上角越好，即表示查全率越高，而误判率越低。

一般来说，如果ROC是光滑的，那么基本可以判断没有太大的过拟合。

ROC曲线有助于比较不同分类器的相对性能。如下两个模型M1和M2，当FPR小于0.36时模型M1较好，而当FPR大于0.36时模型M2较好。

AUC值

与ROC曲线一同使用的，还有AUC指标。

AUC（Area Under Curve），其实就是ROC曲线下方的面积。

因为，ROC曲线一般都处于对角线的上方，即模型的效果应该比瞎猜（猜中的概率为50%）要好，所以AUC的取值范围一般是[0.5，1]。

AUC值越大，即ROC曲线越靠近左上角，其下方的面积越大，说明模型质量越高。

显然，由于ROC/AUC与混淆矩阵的TP、FP、TN、FN四个值都有关，所以，AUC是一个综合的评价指标。AUC值越大，也相当于TP和TN越大越好，FP和FN越小越好。

所以在大多数数据挖掘比赛中，要比较两个模型哪个会更优，AUC指标要比Accuracy指标常用得多，也比其它查全率R和查准率P要常用得多。

PR曲线和BEP值

PR曲线

PR曲线，反应的是查准率P和查全率R之间的关系。以P为横坐标，R作为纵坐标，就是PR网线。

P = TP/(TP+FP)，即模型预测的正类中被正确预测的百分比。

R = FP/(FP+FN)，即正类中被正确预测的百分比。

对于同一个分类模型，通过调整分类的阈值（从大到小变化），就可以得到不同的P-R值，即可画出PR曲线。

显然，我们要求P和R都应该是越高越好。如果一个模型的PR曲线被另一个模型的PR曲线所“包住”，则后者的性能要优于前者。如下图所示，模型A比模型C的性能要好，模型B比模型C的性能也要好。

一般情况下，查准率和查全率这两个指标不可能兼顾。要想查全率R高，则模型需要输出更多的样本（极端地，返回全部样本，则查全率为100%）；要想查准率P高，则要求在模型认为的正类中，尽量地选择少的概率高的样本。

BEP值

PR曲线中，一般要求P和R都越高越好，因此引入了一个指标BEP来表示模型的质量。

BEP（Break Even Point），亦称盈亏平衡点、保本点。即当查准率=查全率时的值。

在上图中，模型A和模型B，由于存在交叉，不太容易判断哪个模型会更好。如果使用BEP来判断，可知模型A的性能要优于模型B的性能。

显然，由于PR /BEP与混淆矩阵的TP、FP、FN三个值都有关（与TN无关），所以，BEP并不是一个综合的评价指标。

但是，即使是正样本非常少的情况下，PR表现的效果也比较好。也就是说，在正负样本不平衡的情况下，PR曲线比ROC曲线能更有效地反应分类器的好坏。

KS曲线和KS值

KS曲线

KS曲线（Kolmogorov-Smirnov），又叫洛伦兹曲线。以TPR和FPR分别分为纵轴，以阈值作为横轴，画出两条曲线。KS曲线反映的是在同一阈值下TPR和FPR的差值。

显然，我们希望的是TPR越高越好，而FPR越低越好，即要求两条折线离得越开越好，这说明模型对于正负样本区分度更好。

可以知道，KS曲线和ROC曲线一样，描述的都是TPR和FPR的关系，只是横坐标的取法不一样。

KS值

考虑到量化，所以将TPR和FPR折线的最远距离作为KS值，即KS=max(TPR-FPR)，作为模型的分区度。

K-S值越大，表示评分模型能够将“好客户”、“坏客户”区分开来的程度越大。

一般认为：

1）当KS<0.2时，模型无鉴别能力

2）在0.2~0.4之间，模型勉强接受，需要考虑优化

3）在0.4~0.5之间，模型有区别能力

4）在0.5~0.6之间，模型有较好的区别能力

5）在0.6~0.7之间，模型有非常好的区别能力

6）当KS>0.75时，要检验模型是否过拟合

由于KS值主要是体现模型中差异的最大的一个分段，因此适合于找阈值。像信用评分卡中，就比较适合使用KS值来评估，寻找出最大的区分度阈值。

曲线对比

一般来说，ROC曲线会更稳定，在正负样本足够（样本均衡）的情况下，ROC曲线会比较稳定，能够反映模型的整体质量。当样本不平衡时，特别是正样本极少时，ROC曲线并不准确。

在样本不均衡时，特别是正样本数远小于负样本数时，采用PR曲线会更合适。

而KS曲线，只是反映出哪个分段的区分度是最大的，而不能反映出总体的效果。所以，KS曲线往往只用在寻找区分的最佳阈值（比如信用评分卡中的审批阈值）。

一般情况下，最好能够综合考虑上述的三种曲线以及三个指标，这样对模型有一个全面的质量评估。

211统计课堂2

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
如何评估分类模型的好坏

一般来说，ROC曲线会更稳定，在正负样本足够（样本均衡）的情况下，ROC曲线会比较稳定，能够反映模型的整体质量。但是，即使是正样本非常少的情况下，PR表现的效果也比较好。因为，ROC曲线一般都处于对角线的上方，即模型的效果应该比瞎猜（猜中的概率为50%）要好，所以AUC的取值范围一般是[0.5，1]。显然，我们希望的是TPR越高越好，而FPR越低越好，即要求两条折线离得越开越好，这说明模型对于正负样本区分度更好。可以知道，KS曲线和ROC曲线一样，描述的都是TPR和FPR的关系，只是横坐标的取法不一样。
复制链接

扫一扫

211统计课堂2 CSDN认证博客专家 CSDN认证企业博客

码龄1年

1: 原创

172万+: 周排名

71万+: 总排名

5497: 访问

: 等级

28: 积分

1: 粉丝

0: 获赞

6: 评论

4: 收藏

私信

关注

热门文章

最新评论

Python基础小讲堂之条件分支与循环
CSDN-Ada助手: 恭喜您写了第8篇博客！标题看起来很有趣，我很期待阅读您关于Python条件分支与循环的讲解。您的持续创作非常值得赞赏，这不仅展示了您对Python的热爱，也让读者们受益匪浅。希望您能继续保持写作的热情，为我们带来更多有趣且有深度的主题。如果可以的话，我建议您在接下来的博客中，可以探讨一些高级的Python概念或者应用，这将进一步拓宽读者们的知识领域。谢谢您的分享，期待您的下一篇博客！
Python实现T检验
CSDN-Ada助手: 恭喜您写了第6篇博客！感谢您分享关于Python实现T检验的内容。您的文章对于学习Python和统计分析的读者来说无疑是一份宝贵的资料。希望您能继续保持创作的热情，并继续分享更多关于Python和统计分析的主题。如果可以的话，我建议您可以探索一下如何使用Python进行假设检验或者其他常用的统计方法，这将进一步丰富您的博客内容。再次感谢您的辛勤付出！
如何评估分类模型的好坏
CSDN-Ada助手: 恭喜您写了第7篇博客！标题“如何评估分类模型的好坏”非常吸引人。您在这篇博客中提供了一个重要的主题，对于那些希望了解如何评估分类模型的人来说，这将是一个非常有用的资源。我非常期待阅读您的博客，并从中学到更多关于分类模型评估的知识。在下一步的创作中，我建议您可以进一步扩展这个主题，例如介绍一些常用的分类模型评估指标，或者讨论一些实际案例，展示如何应用这些评估方法来提高模型的性能。同时，如果您能够在博客中提供一些实用的建议和技巧，帮助读者更好地理解和应用这些评估方法，那将是非常有帮助的。再次恭喜您，并期待您未来更多精彩的博客！
如何使用python连接MySQL数据库？
CSDN-Ada助手: 恭喜您写了第四篇博客！标题“如何使用python连接MySQL数据库？”非常吸引人。您的指导对于想要使用Python连接MySQL数据库的人来说非常有帮助。我希望您能继续分享更多关于数据库连接和操作的内容，比如如何进行数据库查询、更新等操作。谦虚地说，我相信您的经验和知识将会对读者产生更大的帮助。期待您的下一篇博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
R语言主成分分析
CSDN-Ada助手: 恭喜您写了第三篇博客！标题“R语言主成分分析”听起来非常有趣。您的文章内容一定很详尽，并且能够帮助读者更好地理解和应用主成分分析。在下一步的创作中，或许您可以考虑通过实例或案例来说明主成分分析在实际问题中的应用，这样读者能更好地理解其实际意义。期待您的下一篇博文，再次恭喜您！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。