总结:敏感性 = 查全率 = 召回率;查全率又称召回率;查准率即精度。
准确率与之均不同,定义如下:被正确诊断的案例之和与总案例之比即为准确率。
在癌症示例中,敏感性和特异性指:
- 敏感性(sensitivity):在患有癌症的所有人中,诊断正确的人有多少?
- 特异性(speciticity):在未患癌症的所有人中,诊断正确的人有多少?
查准率和查全率的定义如下:
- 查准率(precision):在被诊断患有癌症的所有人中,多少人确实得了癌症?
- 查全率(recall):在患有癌症的所有人中,多少人被诊断患有癌症?
从这里可以看出,敏感性就是查全率,但特异性并不是查准率。
敏感性和特异性是这个矩阵中的行。更具体地说,如果我们做以下标记
- TP:(真阳性)被正确诊断为患病的病人。
- TN:(真阴性)被正确诊断为健康的健康人。
- FP:(假阳性)被错误诊断为患病的健康人。
- FN:(假阴性)被错误诊断为健康的病人。
那么:
敏感性 = TP/(TP + FN)
且
特异性 = TN/(TN + FP)
查准率和查全率是矩阵的第一行和第一列:
查全率 = TP/(TP + FN)
且
查准率 = TP/(TP + FP)
准确率 = (TP + TN)/(TP+TN+FP+FN)
roc曲线:通过使用真阳性率作为x轴,假阳性率作为y轴绘制的曲线。
真阳性率 = 敏感性,假阳性率 = 1 - 特异性
备注:使用的Udacity课程里的案例