真阳假阳真阴假阴指标(TP,FP,TN,FN)精度Precision 准确率Accuracy 召回率Recall 总结

检测相关指标(TP,FP,TN,FN)总结表格

指标定义公式备注
真阳性 (True Positive, TP)预测为阳性,实际为阳性--
假阳性 (False Positive, FP)预测为阳性,实际为阴性--
真阴性 (True Negative, TN)预测为阴性,实际为阴性--
假阴性 (False Negative, FN)预测为阴性,实际为阳性--
精度 (Precision)预测为阳性的样本中实际为阳性的比例Precision = TP / (TP + FP)阳性可信度
准确率 (Accuracy)所有预测正确的样本(无论正负)占总样本的比例Accuracy = (TP + TN) / (TP + TN + FP + FN)阴阳可信度
召回率 (Recall)实际为阳性的样本中被预测为阳性的比例Recall = TP / (TP + FN)阳性找回率
F1得分 (F1-Score)精度和召回率的调和平均F1-Score = 2 * (Precision * Recall) / (Precision + Recall)精度和召回率的平衡
误报率 (False Positive Rate, FPR)实际为阴性的样本中被错误预测为阳性的比例FPR = FP / (FP + TN)-
漏报率 (False Negative Rate, FNR)实际为阳性的样本中被错误预测为阴性的比例FNR = FN / (FN + TP)-

以流感检测为例进行解释

假设我们有一个流感检测工具,并在一个具有100人的小社区中使用这个工具。社区中的人们都接受了这个检测。我们已知实际有30人患有流感,而其余70人没有。

这个检测工具的结果是:它检测出35人为流感阳性,65人为阴性。但在这35人中,只有25人真的患有流感,其他10人实际上是健康的。同时,它错过了5个真实的流感病例,这5个人被误判为阴性。

让我们来计算一下各项指标:

真阳性 (True Positive, TP):25,这是检测工具正确识别出的流感病例。
假阳性 (False Positive, FP):10,这是被检测工具误判为流感,实际上健康的人数。
真阴性 (True Negative, TN):60,这是检测工具正确识别出的健康人数。
假阴性 (False Negative, FN):5,这是实际上患有流感,但被检测工具误判为健康的人数。
接着计算更高级的指标:

精度 (Precision):TP / (TP + FP) = 25 / (25 + 10) = 0.71,所以我们的检测工具有71%的精度,表示预测出的阳性样本中71%是真实的阳性。
准确率 (Accuracy):(TP + TN) / (TP + TN + FP + FN) = (25 + 60) / 100 = 0.85,所以我们的检测工具有85%的准确率,表示所有样本中85%被正确预测。
召回率 (Recall):TP / (TP + FN) = 25 / (25 + 5) = 0.83,所以我们的检测工具有83%的召回率,表示所有真实的阳性样本中83%被正确找出。
F1得分 (F1-Score):2 * (Precision * Recall) / (Precision + Recall) = 2 * (0.71 * 0.83) / (0.71 + 0.83) = 0.77,F1得分是精度和召回率的调和平均,得分越高表示精度和召回率的平衡越好。
误报率 (False Positive Rate, FPR):FP / (FP + TN) = 10 / (10 + 60) = 0.14,所以误报率为14%,表示所有阴性样本中14%被误判为阳性。
漏报率 (False Negative Rate, FNR):FN / (FN + TP) = 5 / (5 + 25)= 0.17,所以漏报率为17%,表示所有阳性样本中有17%被漏报,即未被正确检测出。

通过以上计算,我们得出了各项指标的数值,从而能全面评估这个流感检测工具的性能。我们可以看到,虽然该工具的**准确率(85%)看上去还不错,但其精度(71%)较低,意味着在它判断出的阳性样本中,实际上有近三分之一是健康的。另外,它的召回率(83%)也有一定的提升空间,因为它没有能够识别出所有实际的流感病例。其误报率(14%)漏报率(17%)**也需要改进,以减少对健康人的误判和对病例的漏报。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
cross_val_score函数是用于交叉验证的一个函数,主要用于评估模型的性能。在机器学习领域中,为了准确评估一个模型在未知数据上的性能,我们通常使用交叉验证的方法。 假阳率(False Positive Rate)和真阳率(True Positive Rate)是在二分类问题中用来评估模型性能的指标之一。假阳率是指在实际为负例的样本中被错误地预测为正例的比例,也可以称为误报率;真阳率是指在实际为正例的样本中被正确地预测为正例的比例,也可以称为召回率或灵敏度。 cross_val_score函数通过交叉验证的方法,将数据集划分为若干个子集,依次使用其中一个子集作为验证集,剩余的子集作为训练集。然后对每次划分的模型进行训练和预测,并将预测结果与真实结果进行比较,从而得到模型在每次验证集上的性能指标。 cross_val_score函数默认使用的性能指标准确率Accuracy),即正确预测样本的比例。但是可以通过传递不同的scoring参数来计算其他指标,如假阳率和真阳率等。在sklearn.metrics模块中,有相应的函数可以计算这些指标,例如roc_auc_score可以计算真阳率和假阳率。 综上所述,通过使用cross_val_score函数,并指定计算假阳率和真阳率的方法,可以得到模型在每次交叉验证的数据集上的假阳率和真阳率。这些指标可以帮助我们更全面地评估模型的性能,从而选择最优模型或调整模型参数。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值