机器学习-AUC/ROC

最新推荐文章于 2024-06-11 21:00:00 发布

旺旺丫丫

最新推荐文章于 2024-06-11 21:00:00 发布

阅读量625

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/wangyj705/article/details/83020708

版权

机器学习专栏收录该内容

20 篇文章 5 订阅

订阅专栏

1.ROC

接收者操作特征曲线（receiver operating characteristic curve，或者叫ROC曲线）

ROC空间将伪阳性率（FPR）定义为 X 轴，真阳性率（TPR）定义为 Y 轴。

TPR：在所有实际为阳性的样本中，被正确地判断为阳性之比率。

$TPR=TP/(TP+FN)$

FPR：在所有实际为阴性的样本中，被错误地判断为阳性之比率。

$FPR=FP/(FP+TN)$

给定一个二元分类模型和它的阈值，就能从所有样本的（阳性／阴性）真实值和预测值计算出一个 (X=FPR, Y=TPR) 座标点。

从 (0, 0) 到 (1,1) 的对角线将ROC空间划分为左上／右下两个区域，在这条线的以上的点代表了一个好的分类结果（胜过随机分类），而在这条线以下的点代表了差的分类结果（劣于随机分类）。

完美的预测是一个在左上角的点，在ROC空间座标 (0,1)点，X=0 代表着没有伪阳性，Y=1 代表着没有伪阴性（所有的阳性都是真阳性）；也就是说，不管分类器输出结果是阳性或阴性，都是100%正确。一个随机的预测会得到位于从 (0, 0) 到 (1, 1) 对角线（也叫无识别率线）上的一个点。

2. ROC曲线

上述ROC空间里的单点，是给定分类模型且给定阈值后得出的。但同一个二元分类模型的阈值可能设定为高或低，每种阈值的设定会得出不同的FPR和TPR。

将同一模型每个阈值 的 (FPR, TPR) 座标都画在ROC空间里，就成为特定模型的ROC曲线。

3. AUC

在比较不同的分类模型时，可以将每个模型的ROC曲线都画出来，比较曲线下面积做为模型优劣的指标。

ROC曲线下方的面积（英语：Area under the Curve of ROC (AUC ROC)），其意义是：

因为是在1x1的方格里求面积，AUC必在0~1之间。
假设阈值以上是阳性，以下是阴性；
若随机抽取一个阳性样本和一个阴性样本，分类器正确判断阳性样本的值高于阴性样本之机率 $=AUC$ [1]。
简单说：AUC值越大的分类器，正确率越高。

从AUC判断分类器（预测模型）优劣的标准：

AUC = 1，是完美分类器，采用这个预测模型时，存在至少一个阈值能得出完美预测。绝大多数预测的场合，不存在完美分类器。
0.5 < AUC < 1，优于随机猜测。这个分类器（模型）妥善设定阈值的话，能有预测价值。
AUC = 0.5，跟随机猜测一样（例：丢铜板），模型没有预测价值。
AUC < 0.5，比随机猜测还差；但只要总是反预测而行，就优于随机猜测。

旺旺丫丫

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习-AUC/ROC

1.ROC接收者操作特征曲线（receiver operating characteristic curve，或者叫ROC曲线）ROC空间将伪阳性率（FPR）定义为 X 轴，真阳性率（TPR）定义为 Y 轴。TPR：在所有实际为阳性的样本中，被正确地判断为阳性之比率。FPR：在所有实际为阴性的样本中，被错误地判断为阳性之比率。给定一个二元分类模型和它的阈值，就能从所有样...
复制链接

扫一扫

专栏目录