ML的4个指标——准确率、精确率、召回率与F1 score

yunsaijc

已于 2024-04-19 22:14:46 修改

阅读量1.3k

点赞数 20

分类专栏：学习笔记文章标签：机器学习人工智能

于 2023-12-11 19:53:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41958290/article/details/134934965

版权

学习笔记专栏收录该内容

2 篇文章

订阅专栏

本文详细解释了机器学习中常用的评估指标，包括准确率、精确率、召回率和F1score，通过混淆矩阵展示概念，并指出在不平衡数据情况下，准确率的局限性，强调精确率和召回率的互补性以及F1score作为综合评价的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

原文：个人主页原文

机器学习的分类任务中，准确率(accuracy)、精确率(precision)、召回率(recall)与F1 score是常见的4个评估指标。之前对于这些指标有粗略的了解，如今加深一下理解

混淆矩阵(Confusion Matrix)

混淆矩阵如图所示：

四个值的具体解释为：

TP(True Positive)：被正确预测的正例。即真实值为正，预测值为正
TN：被正确预测的反例
FP：被错误预测的正例。即真实值为负，预测值为正
FN(False Negative)：被错误预测的反例

即，第一个字母指的是预测正误，第二个字母指的是预测结果

准确率(Accuracy)

表示分类正确的样本占总样本个数的比例，即： $Accuracy=\frac{TP+TN}{TP+TN+FP+FN}$

这是最直接的指标，但缺陷在于：当不同类别的样本占比不平衡时，占比大的类别会是影响准确率的最主要因素

举例：当数据集中99%为正例，那么只要分类器一直预测为正，即可达到很高的准确率

因此只有当数据集中各个类别样本比例均衡时，准确率才有较大的参考意义

精确率(Precision)

表示被预测为正的样本中，实际为正样本的比例。即： $Precision=\frac{TP}{TP+FP}$

个人理解一下：

首先，能够影响精确率的只有被预测为正的样本
被预测为正的样本中，如果其他不变
- TP增大（被正确地判断为正的样本增多），精确率变大
- FP增大（被错误地判断为正的样本增多），精确率变小

所以，精确率越高，将负样本误判为正的概率越小

换句话说，提升精确率，是为了不将负样本误判为正（不错判）

召回率(Recall)

表示实际为正的样本中，被预测为正的样本所占比例。即： $Recall=\frac{TP}{TP+FN}$

可以发现，上述文字定义就是将精确率的文字定义倒转过来

个人理解一下：

首先，能够影响召回率的只有实际为正的样本
实际为正的样本中，如果其他不变：
- TP增大（被正确地判断为正的样本增多），召回率变大
- FN增大（被错误地判断为负的样本增多），召回率变小

所以，召回率越高，将正样本误判为负的概率越小

换句话说，提高精确率，是为了不将正样本误判为负（不漏判）

F1 Score

通过上述分析可以发现，精确率和召回率是两难全的。综合一下
两者，F1 score是精确率和召回率的一个加权平均： $F1=2\times\frac{Precision\times Recall}{Precision+Recall}$

因为精确率体现分类器不错判的能力，召回率体现不漏判的能力，所以F1 Score越高，模型越稳健

参考

https://zhuanlan.zhihu.com/p/405658103

https://zhuanlan.zhihu.com/p/93107394

https://zhuanlan.zhihu.com/p/93586831

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。