机器学习的查准率、查全率和F1-score

最新推荐文章于 2024-07-11 21:40:10 发布

云开处

最新推荐文章于 2024-07-11 21:40:10 发布

阅读量2k

点赞数 4

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/qq_48008050/article/details/115731748

版权

本文介绍了机器学习中评价模型性能的查准率、查全率和F1-score。查准率关注正确预测的正例占预测正例的比例，查全率则关注所有正例中被正确识别的比例。两者通常存在矛盾，F1-score作为调和平均数，综合考虑了查准率和查全率，F1值越高表示模型性能越好。通过实例对比，展示了如何计算并比较两个算法的查准率、查全率和F1-score，得出F1-score更高的算法性能更优。

摘要由CSDN通过智能技术生成

一、简介

（一）查准率与查全率

定义：
对于二分类问题，分类结果混淆矩阵与查准/查全率定义如下

在这里插入图片描述

副贴另外一张图：

关系：查准率和查全率是一对矛盾的度量。一般来说，查准率高时，查全率往往偏低;而查全率高时，查准率往往偏低。
P-R图：以查准率为纵轴、查全率为横轴作图，就得到了查准率-查全率曲线

P-R图直观地显示出学习器在样本总上的查全率、查准率在进行比较时，若一个习器的 P-R 曲线被另一个学习器的曲线完全"包住，则可断言后者的性能优于前者，如图2.3学习器A的性能优学习器 C; 如果两个学习器 P-R 曲线发生了交叉例如图2.3中的 A与B，则难以一般性地断两者孰优孰劣，只能在具体的查准率或者全率条件下进行比较，然而，在很多形下，人们往往仍希望把学习器A与B比出个高低，这时一个比较合理的判据是比较 P-R 曲线节面积的大小，它在定程度上表征了学习器在查准率和查全率上取得相对"双高"的比例。但这个值不太容易估算，因此人们设计一些综合考虑查准率、查全率的性能度量。
"平衡点 "(Break-Event Point ，简称 BEP)就是这样一个度量，它是"查准率= 查全率"时的取值，如图 2.3 学习器C的 BEP 是0.64，而基于 BEP的比较，可认为学习器 A优于B。

（二）F-Score

定义：P和R指标有时会出现矛盾的情况，这样就需要综合考虑他们，最常见的方法就是F-Measure，又称F-Score。F-Measure是P和R的加权调和平均，即：
F1-score：特别地，当β=1时，也就是常见的F1度量，是P和R的调和平均，当F1较高时，模型的性能越好。

二、实例

（一）问题

假如某学校准备招标采购一套宿舍行人目标图像识别系统，选择2家公司的产品来测试。测试手段是：从学生宿舍区一段监控视频中识别男生的人数。
实验结果如下：
1）算法1（产品1）的检测结果：检测出“男生”人数82人，其中78人为男生，4人其实是女生；
2）算法2（产品2）的检测结果：检测出“男生”人数88人，其中80人为男生，8人其实是女生；
3）经过人工检测，视频中实际准确的总人数为100人，其中男生80人，女生20人。
请问算法1和算法2的“查准率”“查全率”“F1-score”等分别是多少？你认为哪个更优秀？

（二）解决

1.算法1

由题意得：
- 正例为： $82$
- 真正例： $T P = 78$
- 假正例： $F P = 4$
- 反例为： $18$
- 真反例： $T N =$

最低0.47元/天解锁文章

云开处

关注

4
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
机器学习的查准率、查全率和F1-score

目录一、简介（一）查准率与查全率（二）F-Score二、实例（一）问题（二）解决三、参考资料一、简介（一）查准率与查全率定义：对于二分类问题，分类结果混淆矩阵与查准/查全率定义如下副贴另外一张图：关系：查准率和查全率是一对矛盾的度量。一般来说，查准率高时，查全率往往偏低;而查全率高时，查准率往往偏低。P-R图：以查准率为纵轴、查全率为横轴作图，就得到了查准率-查全率曲线P-R图直观地显示出学习器在样本总上的查全率、查准率在进行比较时，若一个习器的 P-R 曲线被另一个学
复制链接

扫一扫

专栏目录