AUC本质就正样本比负样本打分高的pair占总pair的比例。
AUC反映的是模型将"正样本预测为正例的可能性" 大于 "将负例预测为正例的可能性的" 概率
到底AUC怎么计算呢?举个例子如下:
下表中有如下6条记录:
根据AUC的概念,A和D的得分应该高于其余四条记录中的任意一条。下面开始计算AUC的流程:
我们需要将记录A、D分别与另外四条记录比较,一共有8组对比。这里计算AUC的分母就是8;那么共有多少组对比是满足要求的呢?记录A比另外四组(B、C、E、F)得分都高,记录D只比另外二组(E、F)得分都高,所以八组对比中满足条件的只有6组,那么分子就是6。所以我们计算得到的AUC就是6/8 = 0.75。简单吧?好像确实不是很难耶!
参考文档: