AUC(一)：AUC与Mann–Whitney U test

最新推荐文章于 2024-10-28 17:45:55 发布

cptu

最新推荐文章于 2024-10-28 17:45:55 发布

阅读量6.8k

点赞数 8

分类专栏：机器学习 nlp AUC 文章标签：机器学习深度学习 AUC

本文链接：https://blog.csdn.net/AckClinkz/article/details/89397481

版权

本文详细介绍了AUC（Area Under the Curve）的物理含义，通过分析AUC的计算过程，揭示了AUC与Mann-Whitney U statistic之间的联系。AUC不仅是一种衡量二分类模型性能的指标，其本质也是统计学中的Mann-Whitney U检验。AUC的物理含义是评估正负样本得分相对大小的概率，为机器学习面试和实践提供了深入的理解。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在算法面试中，常常会被一个问题AUC的物理含义是什么。本文参考论文¹，介绍一下AUC的物理含义。

概念

在二分类模型中，预测值 $p$ 表示事件发生的概率。对于分类任务，需要给出一个阈值(threshold)来判别哪些任务是正例、哪些是负例。AUC(Area Under the Curve)提供了一种判别所有阈值效果的指标。AUC的计算逻辑如下所示：

将模型预测值排序
对于每一个阈值计算TPR(True Positive Rate)和FPR(False Positive Rate)
绘制ROC曲线
使用梯形近似计算AUC

根据上述流程，绘制的AUC曲线如下所示

其中横轴代表FPR，纵轴代表TPR。

AUC与Mann-Whitney U statistic

面试中，常常会问AUC的物理含义，绝大部分人都会说：“给出一个正样本与一个负样本，正样本比负样本分值大的概率”。再进一步，为什么是这样的，绝大部分人就懵逼了。下面将回答这个从"what"到"why"的问题。为了便于解释和推导，这里假设不同样例预测值完全不同(not ties)。针对ties的情况，可参见论文[1]。not ties的情况如下

index	label	$\%)$
1	1	98.4
2	1	95.2
3	1	94.4
4	0	92.8
5	1	83.2
6	1	81.6
7	1	58.4
8	0	57.6
9	0	28.0
10	0	13.6
11	1	3.2
12	0	2.4
13	0	1.6
14	0	0.8
15	0	0.0

ties情况

index	label	$\%)$
1	1	98.4
2	1	98.4
3	1	98.4
4	0	98.4
5	1	83.2
6	1	81.6
7	1	58.4
8	0	57.6
9	0	28.0
10	0	13.6
11	1	3.2
12	0	2.4
13	0	1.6
14	0	0.8
15	0	0.0

假设在整个验证集有 $n$ 个样本， $e$ 个正样本， $e^{'} = n - e$ 个负样本。由于假设了预测结果not ties，理想状态下，不同阈值可以将样本切分成 $n$ 块。在上述not ties的例子中，阈值为 $[100, 98.3, 95.1, 94.3, . . . . .]$ 。此时，每选择一个阈值仅会出现下属两种情况下的一种：