分类问题的评价指标（Precision、Recall、Accuracy、F1-Score、Micro-F1、Macro-F1）以及混淆矩阵、ROC曲线

少年龙龙

已于 2022-05-17 00:50:09 修改

阅读量1w

点赞数 18

分类专栏：机器学习 Python学习学习笔记文章标签：机器学习 scikit-learn 经验分享其他

于 2022-05-11 19:45:05 首次发布

本文链接：https://blog.csdn.net/qq_44901949/article/details/124708810

版权

本文详细介绍了分类问题中的关键评价指标，包括真阳性、假阳性和假阴性等基本概念，以及精确率、召回率、准确率和F1-Score的计算与理解。此外，还探讨了宏平均 Macro-F1、微平均 Micro-F1和加权平均在多类别分类中的应用，以及混淆矩阵和ROC曲线在评估模型性能中的作用。通过实例和解释，帮助读者深入理解这些评价指标的含义和重要性。

摘要由CSDN通过智能技术生成

文章目录

一、四个基本概念 TP、FP、TN、FN
二、精确率（precision）、召回率（recall）、准确率（accuracy）
三、F1-Score（F1分数）
四、宏平均 Macro-F1 、微平均 Micro-F1、加权平均 Weighted avg
五、混淆矩阵（Confusion Matrix）
六、ROC 曲线和 AUC（Area Under the Curve，曲线下面积）

一、四个基本概念 TP、FP、TN、FN

真阳性：预测为正，实际为正。把正样本成功预测为正。 TP——True Positive
假阳性：预测为正，实际为负。把负样本错误预测为正。 FP——False Positive ——>误报
真阴性：预测为负、实际为负。把负样本成功预测为负。 TN——True Negative
假阴性：预测与负、实际为正。把正样本错误预测为负。 FN——False Negative ——>漏报
注：一致判真假，预测判阴阳
在这里插入图片描述
1、真阳性：指预测正确，是哪个类就被分到哪个类。对A而言，TP个数为 2；对B而言，TP个数为 2；对C而言，TP个数为 1。

2、假阳性：就是指预测为某个类，但是实际上不是。对A而言，FP个数为 0；对B而言，FP个数为 2；对C而言，FP个数为 2。（因为"3"和"8"都不是B类，但却分给了B，所以为假阳性）

3、假阴性：对A而言，FN个数为 2；对B而言，FN个数为 1；对C而言，FN个数为 1。（因为"3"和"4"分别预测为B和C，但是实际是A，也就是预测为负，实际为正）
在这里插入图片描述

二、精确率（precision）、召回率（recall）、准确率（accuracy）

1、精确率（查准率）：计算预测出来的某类样本中，有多少是被正确预测的。即表示的是预测为正的样本中有多少是真正的正样本。针对预测样本而言。

2、召回率（查全率）：有多少样本被正确的预测出来了，即该类样本有多少被找出来（召回了多少）。即表示的是样本中的正例有多少被预测正确了。针对原先实际样本而言。

3、准确率：正类和负类预测准确的比例。在正例较少负例较多的不平衡分类问题（疾病；恐怖分子）中，存在着如果把所有数据全部预测为负例，准确率依然会很高的问题，所以引入召回率。
根据多分类结果，可以根据样本的预测结果是否正确来形成混淆矩阵。
在这里插入图片描述
（1）加权准确率（Weighted Accuracy，WA）

（2）非加权准确率（Unweighted Accuracy，UA）

精确率

最低0.47元/天解锁文章

少年龙龙

关注

18
点赞
踩
108

收藏

觉得还不错? 一键收藏
打赏
4
评论
分类问题的评价指标（Precision、Recall、Accuracy、F1-Score、Micro-F1、Macro-F1）以及混淆矩阵、ROC曲线

文章目录一、四个基本概念 TP、FP、TN、FN二、精确率（precision）、召回率（recall）、准确率（accuracy）三、F1-Score（F1分数）四、宏平均 Macro-F1 、微平均 Micro-F1、加权平均 Weighted avg五、混淆矩阵（Confusion Matrix）六、ROC 曲线和 AUC（Area Under the Curve，曲线下面积）一、四个基本概念 TP、FP、TN、FN真阳性：预测为正，实际为正。把正样本成功预测为正。 TP——True Posit
复制链接

扫一扫