评估指标：精确率（Precision）、召回率（Recall）、F1分数（F1 Score）

FriendshipT

已于 2024-07-11 22:07:32 修改

阅读量3k

点赞数 28

分类专栏：人工智能知识点文章标签：人工智能损失函数深度学习机器学习

于 2024-07-11 22:07:02 首次发布

本文链接：https://blog.csdn.net/FriendshipTang/article/details/138572453

版权

人工智能知识点专栏收录该内容

14 篇文章

订阅专栏

评估指标：精确率（Precision）、召回率（Recall）、F1分数（F1 Score）

前言
相关介绍
F1分数 (F1 Score)

在这里插入图片描述

前言

由于本人水平有限，难免出现错漏，敬请批评改正。
更多精彩内容，可点击进入人工智能知识点专栏、Python日常小操作专栏、OpenCV-Python小应用专栏、YOLO系列专栏、自然语言处理专栏或我的个人主页查看
基于DETR的人脸伪装检测
YOLOv7训练自己的数据集（口罩检测）
YOLOv8训练自己的数据集（足球检测）
YOLOv5：TensorRT加速YOLOv5模型推理
YOLOv5：IoU、GIoU、DIoU、CIoU、EIoU
玩转Jetson Nano（五）：TensorRT加速YOLOv5目标检测
YOLOv5：添加SE、CBAM、CoordAtt、ECA注意力机制
YOLOv5：yolov5s.yaml配置文件解读、增加小目标检测层
Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
YOLOv5：使用7.0版本训练自己的实例分割模型（车辆、行人、路标、车道线等实例分割）
使用Kaggle GPU资源免费体验Stable Diffusion开源项目

F1分数 (F1 Score)

F1分数（F1 Score）是一种广泛应用于二分类和多分类问题中的性能评价指标，特别是对于类别不平衡的数据集而言，它能提供比单一的精确率或召回率更为全面的性能评估。下面是F1分数的详细解析，包括其计算方法、优势和局限性：

F1分数的计算

F1分数是精确率（Precision）和召回率（Recall）的调和平均数，旨在综合这两个指标，以反映模型在分类任务中的平衡表现。其计算公式为：

$\times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}$

精确率（Precision） 表示模型预测为正类别的样本中，真正为正类别的比例，计算公式为 (\frac{\text{真正例（TP）}}{\text{真正例（TP）} + \text{假正例（FP）}})。
召回率（Recall） 表示所有实际为正类别的样本中，被模型正确识别的比例，计算公式为 (\frac{\text{真正例（TP）}}{\text{真正例（TP）} + \text{假阴例（FN）}})。

F1分数的优点

平衡精确率和召回率：F1分数同时考虑了模型预测的精确性和完整性，对于需要两者都达到较高水平的应用非常适用。
类别不平衡数据集：在正负样本数量差距较大的情况下，F1分数能够给出更为公平的性能评估，相比单独使用精确率或召回率更能反映出模型的整体效能。
单一指标：作为一个单一的数值指标，F1分数简化了模型性能的比较，便于理解和沟通。

F1分数的缺点

权重固定：F1分数对精确率和召回率给予相同的权重（即1:1），但在某些应用场景下，根据具体需求，可能需要对二者赋予不同的重要性（例如，某些情况下召回率可能比精确率更重要）。
忽视真负例（TN）：F1分数完全依赖于正例的预测情况，忽略了模型正确预测为负例的能力，因此在某些场景下可能不足以全面评估模型性能，尤其是当错误地分类负例成本也很高时。
极端情况：当精确率和召回率中有一个为0时，F1分数也会变为0，即使另一个指标非常高，这可能在某些情况下显得过于苛刻。

综上所述，F1分数是衡量分类模型性能的有效工具，尤其适合评估那些需要均衡考虑精确率和召回率的应用场景。然而，在选择评估指标时，应考虑具体任务的需求，有时可能需要结合其他指标如AUC-ROC、Precision-Recall曲线等进行综合分析。

计算实例

F1分数是一种统计度量，用于评估二分类（或多标签分类中的每一个类别）模型的性能，它是精确率（Precision）和召回率（Recall）的调和平均值。下面通过一个简单的例子来说明如何计算F1分数：

示例数据

假设我们有一个二分类问题，模型预测的结果和实际标签如下：

真实正例（TP，True Positives）: 25个
假正例（FP，False Positives）: 5个
真实负例（TN，True Negatives）: 70个
假负例（FN，False Negatives）: 10个

计算精确率（Precision）

精确率是指模型预测为正例中实际确实是正例的比例。
$\text{Precision} = \frac{\text{TP}}{\text{TP} + \text{FP}} = \frac{25}{25 + 5} = \frac{25}{30} = 0.8333$

计算召回率（Recall）

召回率是指实际正例中被模型正确识别出来的比例。
$\text{Recall} = \frac{\text{TP}}{\text{TP} + \text{FN}} = \frac{25}{25 + 10} = \frac{25}{35} = 0.7143$

计算F1分数 (F1 Score)

F1分数结合了精确率和召回率，公式如下：
$\text{F1 Score} = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}$
将上面计算的精确率和召回率代入公式中：
$\text{F1 Score} = 2 \times \frac{0.8333 \times 0.7143}{0.8333 + 0.7143} \approx 2 \times \frac{0.5972}{1.5476} \approx 2 \times 0.3864 = 0.7728$

因此，基于这个示例，模型的F1分数大约为0.7728。F1分数越接近1，表明模型在精确率和召回率方面的综合性能越好。

由于本人水平有限，难免出现错漏，敬请批评改正。
更多精彩内容，可点击进入人工智能知识点专栏、Python日常小操作专栏、OpenCV-Python小应用专栏、YOLO系列专栏、自然语言处理专栏或我的个人主页查看
基于DETR的人脸伪装检测
YOLOv7训练自己的数据集（口罩检测）
YOLOv8训练自己的数据集（足球检测）
YOLOv5：TensorRT加速YOLOv5模型推理
YOLOv5：IoU、GIoU、DIoU、CIoU、EIoU
玩转Jetson Nano（五）：TensorRT加速YOLOv5目标检测
YOLOv5：添加SE、CBAM、CoordAtt、ECA注意力机制
YOLOv5：yolov5s.yaml配置文件解读、增加小目标检测层
Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
YOLOv5：使用7.0版本训练自己的实例分割模型（车辆、行人、路标、车道线等实例分割）
使用Kaggle GPU资源免费体验Stable Diffusion开源项目