理解ROC/AUC
接上一篇清晰简明混淆矩阵:
下图表示训练集(假设只有一个特征维度)关于特征维度的分布情况。根据某一算法,确定的临界值如图。小于临界值
y
=
−
1
y=-1
y=−1,大于临界值
y
=
1
y=1
y=1
从上帝视角来看一下,表现如何?下图表示将
y
=
−
1
,
y
=
1
y=-1,y=1
y=−1,y=1分别画出关于这一特征的分布情况(上一个图是整体分布)。
根据上图,和混淆矩阵的对应关系如下图(仅仅为示意图,比例有调整):
性能度量 | ROC坐标轴 | 公式 | 备注 |
---|---|---|---|
True Positive Rate | Y | T P T P + F N \frac{TP}{TP+FN} TP+FNTP | Recall,sensitivity |
False Positive Rate | X | F P F P + T N \frac{FP}{FP+TN} FP+TNFP | 1-specificity |
ROC曲线下方的面积(Area Under Curve,AUC)是性能的度量,靠近左上角,性能更好。