ROC曲线及EER介绍

引言

 本文旨在介绍ROC曲线及其前置概念如混淆矩阵、FPR、TPR等,还有其引申概念EER、AUC等等。

ROC的引入

 ROC曲线是一张用于评价二分类模型的曲线图,典型如下图所示:
在这里插入图片描述
理论上来说,该曲线越靠近坐标系的左上角说明该二分类器的表现越好,一个理想的二分类的ROC曲线应如下图所示:
在这里插入图片描述

混淆矩阵

 为了了解ROC曲线横纵轴所代表的意义及曲线的内涵,我们需要先介绍二分类器的另一个评估指标–混淆矩阵,混淆矩阵是由给定了二分类器的分类阈值情况下,计算不同类型样本数目所构造的表格(分类阈值指当 s c o r e > T , y ^ = 1 score>T,\hat{y}=1 score>T,y^=1,当 s c o r e ≤ T , y ^ = 0 score\leq T,\hat{y}=0 scoreT,y^=0或相反情况),表格具体如下表所示。

预测·真预测·假总和
真实·真TPFNActual positive: TP+FN
真实·假FPTNActual negative: FP+TN
总和Predicted positive: TP+FPPredicted negative:FN+TNTP+FN+FP+TN

以TP为例进行解释:预测为真,实际也为真的样本的数目,其余同理。
由混淆矩阵引申出几个比值的概念:
T P R = T P T P + F N F P R = F P F P + T N T N R = T N F P + T N F N R = F N T P + F N TPR=\frac{TP}{TP+FN} \\ FPR=\frac{FP}{FP+TN}\\ TNR=\frac{TN}{FP+TN}\\ FNR=\frac{FN}{TP+FN} TPR=TP+FNTPFPR=FP+TNFPTNR=FP+TNTNFNR=TP+FNFN

TPR描述真实样本中预测为真的比例
FPR描述虚假样本中预测为真的比例
TNR描述虚假样本中预测为假的概率
FPR描述虚假样本中预测为真的概率

 ROC曲线中的横轴即为FPR,纵轴为TPR,即首先指定一系列的阈值 T 1 , T 2 , T 3 . . T_1,T_2,T_3.. T1,T2,T3..,使得二分类器的FPR指标由0变化至1,计算出相应的TPR变化情况,从而绘制了ROC曲线,给出表格形式如下:

阈值 T 1 T_1 T1 T 2 T_2 T2 T 3 T_3 T3 T 4 T_4 T4
FPR01
TPR01

ROC曲线的解释

 ROC曲线想要反应的是二分类器在不同阈值选取下的耐受情况,即当我们阈值设置的过低时TPR肯定很高,即真实样本都会判断为真实样本,但这很显然是不对的,当我们阈值设置的过高时,FPR肯定也很低,即虚假样本都会判断为虚假样本,同样也不符合实际场景。我们需要的好的分类器应该是付出一定阈值代价使得FPR有点高的同时,TPR仍然保有较高值,即折中阈值。
以图像形式展示如下:
在这里插入图片描述

可以看出当阈值 T = T 3 T=T_3 T=T3时,FPR=0,但TPR较小(真样本被误判为假);
当阈值 T = T 2 T=T_2 T=T2时,TPR=1,但FPR较大(假样本被误判为真);
因此我们应该选取 T = T 1 T=T_1 T=T1以使得FPR、TPR进行折中。

EER

 在前文中我们提到,我们希望选取的阈值应该是使得真样本被判假和假样本被判真折中,即FPR=FNR,而FNR=1-TPR,所以我们实际上只需要在图中画一条TPR=1-FPR的直线,找到它与ROC曲线的交点,该点对应的阈值即为我们一般会设置为二分类器参数的阈值,该点对应的FPR=FNR即为EER,越小越好。
在这里插入图片描述

AUC

 AUC即为ROC曲线下的面积,从前述介绍来看,ROC曲线越靠近左上角越好,意味着换取TPR(T较小)很大时不用付出较大的FPR作为代价,因此曲线下的面积也会越大。即AUC越大,说明二分类器效果越好。

  • 1
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值