首先:
1. TP,FP,TN,FN
TP:True Positive,预测为正样本;实际也为正样本的特征数
FP:False Positive,预测为正样本;实际为负样本的特征数
TN:True Negative,预测为负样本;实际也为负样本的特征数
FN:False Negative,预测为负样本;实际为正样本的特征数
蓝后:
ROC曲线,PR曲线和AUC
ROC曲线:接收者操作特征曲线receiver operating characteristic curve,是反映敏感性和特异性连续变量的综合指标,roc曲线上每个点反映着对同一信号刺激的感受性
横坐标:1-Specificity,伪正类率False positive rate, FPR,TPR=TP/(TP+FN)=Recall,TPR就是召回率,即预测为正但实际为负的样本占所有负例样本的比例,FPR越大,预测正类中实际负类越多
纵坐标:Sensitivity,真正类率(True positive rate, TPR),预测为正且实际为正的样本占所有正例样本的比例,TPR越大,预测正类中实际正类越多
理想目标:TPR=1,FPR=0,即图中(0,1)点,故ROC曲线越靠拢(0,1)点,越偏离45度对角线越好,Sensitivity和Specificity越大效果越好