检测相关指标(TP,FP,TN,FN)总结表格
指标 | 定义 | 公式 | 备注 |
---|---|---|---|
真阳性 (True Positive, TP) | 预测为阳性,实际为阳性 | - | - |
假阳性 (False Positive, FP) | 预测为阳性,实际为阴性 | - | - |
真阴性 (True Negative, TN) | 预测为阴性,实际为阴性 | - | - |
假阴性 (False Negative, FN) | 预测为阴性,实际为阳性 | - | - |
精度 (Precision) | 预测为阳性的样本中实际为阳性的比例 | Precision = TP / (TP + FP) | 阳性可信度 |
准确率 (Accuracy) | 所有预测正确的样本(无论正负)占总样本的比例 | Accuracy = (TP + TN) / (TP + TN + FP + FN) | 阴阳可信度 |
召回率 (Recall) | 实际为阳性的样本中被预测为阳性的比例 | Recall = TP / (TP + FN) | 阳性找回率 |
F1得分 (F1-Score) | 精度和召回率的调和平均 | F1-Score = 2 * (Precision * Recall) / (Precision + Recall) | 精度和召回率的平衡 |
误报率 (False Positive Rate, FPR) | 实际为阴性的样本中被错误预测为阳性的比例 | FPR = FP / (FP + TN) | - |
漏报率 (False Negative Rate, FNR) | 实际为阳性的样本中被错误预测为阴性的比例 | FNR = FN / (FN + TP) | - |
以流感检测为例进行解释
假设我们有一个流感检测工具,并在一个具有100人的小社区中使用这个工具。社区中的人们都接受了这个检测。我们已知实际有30人患有流感,而其余70人没有。
这个检测工具的结果是:它检测出35人为流感阳性,65人为阴性。但在这35人中,只有25人真的患有流感,其他10人实际上是健康的。同时,它错过了5个真实的流感病例,这5个人被误判为阴性。
让我们来计算一下各项指标:
真阳性 (True Positive, TP):25,这是检测工具正确识别出的流感病例。
假阳性 (False Positive, FP):10,这是被检测工具误判为流感,实际上健康的人数。
真阴性 (True Negative, TN):60,这是检测工具正确识别出的健康人数。
假阴性 (False Negative, FN):5,这是实际上患有流感,但被检测工具误判为健康的人数。
接着计算更高级的指标:
精度 (Precision):TP / (TP + FP) = 25 / (25 + 10) = 0.71,所以我们的检测工具有71%的精度,表示预测出的阳性样本中71%是真实的阳性。
准确率 (Accuracy):(TP + TN) / (TP + TN + FP + FN) = (25 + 60) / 100 = 0.85,所以我们的检测工具有85%的准确率,表示所有样本中85%被正确预测。
召回率 (Recall):TP / (TP + FN) = 25 / (25 + 5) = 0.83,所以我们的检测工具有83%的召回率,表示所有真实的阳性样本中83%被正确找出。
F1得分 (F1-Score):2 * (Precision * Recall) / (Precision + Recall) = 2 * (0.71 * 0.83) / (0.71 + 0.83) = 0.77,F1得分是精度和召回率的调和平均,得分越高表示精度和召回率的平衡越好。
误报率 (False Positive Rate, FPR):FP / (FP + TN) = 10 / (10 + 60) = 0.14,所以误报率为14%,表示所有阴性样本中14%被误判为阳性。
漏报率 (False Negative Rate, FNR):FN / (FN + TP) = 5 / (5 + 25)= 0.17,所以漏报率为17%,表示所有阳性样本中有17%被漏报,即未被正确检测出。
通过以上计算,我们得出了各项指标的数值,从而能全面评估这个流感检测工具的性能。我们可以看到,虽然该工具的**准确率(85%)看上去还不错,但其精度(71%)较低,意味着在它判断出的阳性样本中,实际上有近三分之一是健康的。另外,它的召回率(83%)也有一定的提升空间,因为它没有能够识别出所有实际的流感病例。其误报率(14%)和漏报率(17%)**也需要改进,以减少对健康人的误判和对病例的漏报。