形象理解AUC计算公式
AUC是评价一个二分类器性能的主流数值指标,定义为ROC曲线下方的面积,但这个算起来比较复杂,需要统计假阳性。另一个定义更直观,随机给一个正样本和一个负样本,多大概率正样本的score更高。
换一种说法,假设正样本有 M M M个,负样本有 N N N个,在所有 M ∗ N M*N M∗N个正负样本对中,有多少正样本比负样本分高。提高AUC意味着,将所有样本按score排序,正样本要尽量排在负样本前面。各大博客贴出的AUC计算公式为
A U C = ∑ 正 样 本 R a n k i − 0.5 ∗ ( M + 1 ) ∗ M M ∗ N AUC=\frac{\sum_{正样本}{Rank_i} - 0.5 * (M+1) * M}{M*N} AUC=M∗N∑正样本Rank