AUC的定义是ROC曲线的下部的面积,概率意义是随机取一对正负样本,正样本得分大于负样本得分的概率。
这个概念直观上能看懂但是很难理解为什么和ROC曲线的下部面积有关,下面给出一个我直观上的理解
首先是ROC曲线绘制所用到的混淆矩阵
预测值 | 预测值 | ||
---|---|---|---|
1 | 0 | ||
真实值 | 1 | TP | FN |
真实值 | 0 | FP | TN |
-
混淆矩阵
-
TPR = TP / (TP + FN)
-
- 所有真实类别为1的样本中,预测类别为1的比例
FPR = FP / (FP + TN)
-
- 所有真实类别为0的样本中,预测类别为1的比例
假如我们有一组预测值和真实值,概率大小从大到小已经排列好
P1 | P2 | P3 | P4 | N1 | N2 | N3 | N4 |
---|---|---|---|---|---|---|---|
0.9 |