一句话总结:
敏感性高=漏诊率低
特异性低=误诊率高
参考链接:https://www.zhihu.com/question/30750849/answer/49302571
注意:正例实际上是指我们所关注的类别,如癌症判断中,我们关注的是患病,所以患有癌症为正例,也叫阳性;未患病为负例,也叫阴性。
TP:真正例,也叫真阳性。被正确诊断为患病的病人
FN:假负例,也叫假阴性。被错误诊断为健康的病人
FP:假正例,也叫假阳性。被错误诊断为患病的健康人(也就是误诊)
TN:真负例,也叫真阴性。被正确诊断为健康的健康人
其中:
查全率=召唤率= R e c a l l = T P T P + F N Recall=\frac{TP}{TP+FN} Recall=TP+FNTP
查准率= P r e c i s i o n = T P T P + F P Precision=\frac{TP}{TP+FP} Precision=TP+FPTP
敏感性 = T P T P + F N \frac{TP}{TP + FN} TP+FNTP=查全率(查全率高,即漏诊率低)
特异性 = T N T N + F P \frac{TN}{TN + FP} TN+FPTN=1- F P T N + F P \frac{FP}{TN + FP} TN+FPFP=1-FP rate(FP rate表示负例中标错的概率,ROC曲线的横轴)
- 查全率应该是表示实际患有癌症的人中有多少被诊断出来了
- 查准率应该是表示被诊断为癌症中有多少实际患有癌症
- 特异性低,则FP rate高,即负例中标错的概率高,即阴性被误诊为阳性的概率高,即误诊率高
例题:ROC (受试者工作特征曲线, receiver operating characteristic curve)描绘了分类器在 fp rate (错误的正例,横轴) 和tp rate(真正正例,纵轴) 间的trade-off(权衡)。
答案: (纵轴)敏感性高=漏诊率低, 而(横轴)特异性低=误诊率高