机器学习笔记1：ROC和GINI

最新推荐文章于 2024-08-22 21:27:36 发布

很会飞的猪

最新推荐文章于 2024-08-22 21:27:36 发布

阅读量2.1k

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40105364/article/details/81322917

版权

在不平衡分类问题中，如贷款反欺诈，accuracy rate不再适用。ROC和AUC成为评估模型性能的重要指标。ROC曲线通过TPR（真阳性率）和FPR（假阳性率）展示模型的敏感性和特异性，而AUC是ROC曲线下的面积，反映了模型的泛化能力。Gini系数与AUC正相关，用于衡量分类效果。

摘要由CSDN通过智能技术生成

ROC和GINI

一、imbalanced classification problem

一些简单的分类问题可以用accuracy来衡量分类模型的优劣，而对于观测样本差距较大的分类问题（imbalanced classification problem）则须采取其他方法衡量。

例如，贷款反欺诈问题，假设总共有1000个诚实样本，10个欺诈样本，如何评价以下两个模型的优劣：

模型1：10个欺诈样本中未识别7个，1000个诚实样本中有50个被误判为欺诈。

模型2：10个欺诈样本中未识别3个，1000个诚实样本中有100个被误判为欺诈。

模型1的出现57个差错，模型2出现103个差错，如果按照accuracy rate判断，模型1显然胜出。但是，少量欺诈却会给银行带来重大损失，换句话说，欺诈被误判为诚实的代价，要远远高于诚实被误判为欺诈的代价。在这种情况下，我们需要寻找其它衡量模型优劣的方法替代accuracy rate。ROC和AUC是一种常见的替代方法。

二、ROC

（一）分类结果的四种情况

我们将上述问题的实际欺诈样本称为p

最低0.47元/天解锁文章

很会飞的猪

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。