机器学习笔记1:ROC和GINI

在不平衡分类问题中,如贷款反欺诈,accuracy rate不再适用。ROC和AUC成为评估模型性能的重要指标。ROC曲线通过TPR(真阳性率)和FPR(假阳性率)展示模型的敏感性和特异性,而AUC是ROC曲线下的面积,反映了模型的泛化能力。Gini系数与AUC正相关,用于衡量分类效果。
摘要由CSDN通过智能技术生成

ROC和GINI

 

一、imbalanced classification problem

一些简单的分类问题可以用accuracy来衡量分类模型的优劣,而对于观测样本差距较大的分类问题(imbalanced classification problem)则须采取其他方法衡量。

例如,贷款反欺诈问题,假设总共有1000个诚实样本,10个欺诈样本,如何评价以下两个模型的优劣:

模型1:10个欺诈样本中未识别7个,1000个诚实样本中有50个被误判为欺诈。

模型2:10个欺诈样本中未识别3个,1000个诚实样本中有100个被误判为欺诈。

模型1的出现57个差错,模型2出现103个差错,如果按照accuracy rate判断,模型1显然胜出。但是,少量欺诈却会给银行带来重大损失,换句话说,欺诈被误判为诚实的代价,要远远高于诚实被误判为欺诈的代价。在这种情况下,我们需要寻找其它衡量模型优劣的方法替代accuracy rate。ROC和AUC是一种常见的替代方法。

二、ROC

(一)分类结果的四种情况

我们将上述问题的实际欺诈样本称为p

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值