真正类率(true positive rate) 计算公式 TPR = TP/( TP+FN)
TP : 正确肯定的数目 FN:漏报,没有正确找到的匹配的数目。
指的是分类器所识别的,正实例占所有正实例的比例。
负正类率(false positive rate) 计算公式 FPR = FP/(FP+TN)
计算的是分类器错认为正类的负实例所占实例的比例。
ROC曲线的横纵坐标分别为负正类率,真正类率。
ROC曲线用于评价一个分类器,如果说已确定了一个阈值,那么大于这个阈值的实例就归为正类,小于这个值就归为负类。
ROC曲线指受试者工作特征曲线 / 接收器操作特性曲线(receiver operating characteristic curve), 是反映敏感性和特异性连续变量的综合指标,是用构图法揭示敏感性和特异性的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出一系列敏感性和特异性,再以敏感性为纵坐标、(1-特异性)为横坐标绘制成曲线,曲线下面积越大,诊断准确性越高。在ROC曲线上,最靠近坐标图左上方的点为敏感性和特异性均较高的临界值。
在理想情况下,TPR应接近1,FPR应接近0,ROC曲线上的每一个点对应一个阈值,对于一个分类器,每个临界值下会有一个TPR和FPR。当threshold最大时,TP=FP=0 对应于原点,threshold最小时,TN = FN =0,对应于右上角的点(1,1)。随着阈值的增加TP和FP都减小ÿ