机器学习中的模型评估指标：准确率、召回率与F1分数详解

人工智能教程

于 2025-05-13 14:08:53 发布

阅读量732

点赞数 9

文章标签：机器学习人工智能 transformer bert 架构线性回归数据结构

本文链接：https://blog.csdn.net/2501_91624122/article/details/147923094

版权

前言

在机器学习项目中，模型评估是验证模型性能的关键步骤。不同的评估指标可以帮助我们从不同角度理解模型的优劣。准确率（Accuracy）、召回率（Recall）和F1分数（F1 Score）是分类任务中最常用的评估指标。本文将详细解释这三个指标的定义、计算方法以及它们在实际应用中的意义，帮助你更好地选择和评估机器学习模型。

免费分享一些我整理的人工智能学习资料给大家，包括一些AI常用框架实战视频、图像识别、OpenCV、NLQ、机器学习、pytorch、计算机视觉、深度学习与神经网络等视频、课件源码、国内外知名精华资源、AI热门论文、行业报告等。

下面是部分截图，关注VX公众号【咕泡AI 】发送暗号 666 领取

一、准确率（Accuracy）

准确率是最直观的评估指标，它表示模型正确预测的样本数占总样本数的比例。

（一）定义

准确率定义为： Accuracy=总样本数正确预测的样本数

（二）计算方法

假设我们有一个二分类问题，模型的预测结果可以分为以下四种情况：

真正例（TP，True Positive）：模型正确预测为正类的样本数。
假正例（FP，False Positive）：模型错误预测为正类的样本数。
真负例（TN，True Negative）：模型正确预测为负类的样本数。
假负例（FN，False Negative）：模型错误预测为负类的样本数。

准确率可以表示为： Accuracy=TP+TN+FP+FNTP+TN

（三）示例

假设我们有一个分类模型，其预测结果如下：

TP = 80
FP = 10
TN = 90
FN = 20

准确率计算为： Accuracy=80+90+10+2080+90=200170=0.85

二、召回率（Recall）

召回率衡量的是模型正确预测的正类样本数占实际正类样本数的比例，也称为真正例率（True Positive Rate, TPR）。

（一）定义

召回率定义为： Recall=TP+FNTP

（二）计算方法

使用上述的TP和FN值，召回率可以表示为： Recall=TP+FNTP

（三）示例

使用上述数据：

TP = 80
FN = 20

召回率计算为： Recall=80+2080=10080=0.80

三、F1分数（F1 Score）

F1分数是准确率和召回率的调和平均数，它综合考虑了准确率和召回率，适用于正负样本不平衡的情况。

（一）定义

F1分数定义为： F1 Score=2×Precision+RecallPrecision×Recall

其中，精确率（Precision）定义为： Precision=TP+FPTP

（二）计算方法

使用上述的TP、FP和FN值，精确率和F1分数可以表示为： Precision=TP+FPTP F1 Score=2×Precision+RecallPrecision×Recall

（三）示例

使用上述数据：

TP = 80
FP = 10
FN = 20

精确率计算为： Precision=80+1080=9080≈0.89

F1分数计算为： F1 Score=2×0.89+0.800.89×0.80≈2×1.690.712≈0.84

四、Python实现

在Python中，我们可以使用sklearn.metrics模块来计算这些评估指标。

Python

复制

from sklearn.metrics import accuracy_score, recall_score, precision_score, f1_score

# 示例数据
y_true = [1, 0, 1, 1, 0, 1, 0, 0, 1, 1]
y_pred = [1, 0, 1, 0, 0, 1, 1, 0, 1, 0]

# 计算准确率
accuracy = accuracy_score(y_true, y_pred)
print(f'Accuracy: {accuracy:.2f}')

# 计算召回率
recall = recall_score(y_true, y_pred)
print(f'Recall: {recall:.2f}')

# 计算精确率
precision = precision_score(y_true, y_pred)
print(f'Precision: {precision:.2f}')

# 计算F1分数
f1 = f1_score(y_true, y_pred)
print(f'F1 Score: {f1:.2f}')

五、指标选择

在实际应用中，选择合适的评估指标取决于具体问题的需求：

准确率：适用于正负样本比例相对平衡的情况。
召回率：当正类样本非常重要且不能漏检时，召回率更为重要。
F1分数：当需要综合考虑精确率和召回率时，F1分数是一个很好的选择，特别是当正负样本比例不平衡时。

六、总结

通过本文的介绍，你已经了解了准确率、召回率和F1分数的定义、计算方法以及它们在实际应用中的意义。这些评估指标可以帮助你从不同角度评估机器学习模型的性能，从而选择最适合的模型。希望这篇文章能够帮助你更好地理解和应用这些评估指标，提升你的机器学习项目效果。如果你在实践过程中有任何问题，欢迎在评论区留言，我们一起交流和进步！