- 图中红线为ROC曲线,线上每个点对应一个阈值。横轴FPR越大,预测坏类中实际好类越多。纵轴TPR越大,预测好类中实际好类越多。理想目标:TPR=1,FPR=0,即图中的(0,1)点,故ROC曲线越靠拢(0,1)点,越偏离45度对角线越好,TPR越大越好。
Python模块: from sklearn.metrics import roc_curve
TPR= TP / TP+FN : 灵敏度(真阳率,召回率) 识别的正例占所有实际比例的比例
FPR= FP / FP+TN : 特异度(假阳率)识别的假阳例占所有实际负例的比例
- FPR表示模型判断错的程度,而TPR是模型判断对的程度,我们当然希望判断错的概率越少越好,判断对的概率越多越好,所以党TPR越高,FPR就越低,模型性能就越好
- AUC代表ROC曲线下的面积,表示预测准确率。一般场景下, AUC 的取值范围一般为 0.5~1, 值越大, 说明模型的性能越好
Python模块: from sklearn.metrics import roc_auc_score