AUC的本质:
一个正例,一个负例,预测为正的概率值比预测为负的概率值还要大的可能性。
理解
二分类的准确率为100%
那么你就可以找到一个很好的阈值,将这两类分割开
则正类的预测概率永远比负类的大
也就是AUC=1
你想一下,如果这个可能性为100%的话
你计算出来的正样本的这个值(概率)比负样本(概率)大的可能性(其实也是概率)
这里是说给你一个正样本和一个负样本
就是我们比如logistic回归,输出一个值来表示分类,输出的值的意义是表示正类的概率,比如我们的阈值是0.5,那么输出0.7, 0.8的样本就都是正类,而输出0.3, 0.2的是负类。
这种一般都是用来判断二分类的性能的
你理解了吧,反正我是理解了。
这样面积不就为1
100%的roc就是非常完美啊,顺着y轴上升,然后横过去啊
如果这个可能性不是100%,那么就说明有一些负类,他输出的值比一些正类的还要大,那么这时候这些负类就可能是FP(False Positive,被误认为是正类),而那些值比这些负类小的正类就可能成为FN(False Negative,被误认为是负类)