分类问题的评价指标(Precision、Recall、Accuracy、F1-Score、Micro-F1、Macro-F1)以及混淆矩阵、ROC曲线

本文详细介绍了分类问题中的关键评价指标,包括真阳性、假阳性和假阴性等基本概念,以及精确率、召回率、准确率和F1-Score的计算与理解。此外,还探讨了宏平均 Macro-F1、微平均 Micro-F1和加权平均在多类别分类中的应用,以及混淆矩阵和ROC曲线在评估模型性能中的作用。通过实例和解释,帮助读者深入理解这些评价指标的含义和重要性。
摘要由CSDN通过智能技术生成

一、四个基本概念 TP、FP、TN、FN

真阳性:预测为正,实际为正。把正样本成功预测为正。 TP——True Positive
假阳性:预测为正,实际为负。把负样本错误预测为正。 FP——False Positive  ——>误报
真阴性:预测为负、实际为负。把负样本成功预测为负。 TN——True Negative
假阴性:预测与负、实际为正。把正样本错误预测为负。 FN——False Negative  ——>漏报
:一致判真假,预测判阴阳
在这里插入图片描述
1、真阳性:指预测正确,是哪个类就被分到哪个类。对A而言,TP个数为 2;对B而言,TP个数为 2;对C而言,TP个数为 1。

2、假阳性:就是指预测为某个类,但是实际上不是。对A而言,FP个数为 0;对B而言,FP个数为 2;对C而言,FP个数为 2。(因为"3"和"8"都不是B类,但却分给了B,所以为假阳性)

3、假阴性:对A而言,FN个数为 2;对B而言,FN个数为 1;对C而言,FN个数为 1。(因为"3"和"4"分别预测为B和C,但是实际是A,也就是预测为负,实际为正)
在这里插入图片描述

二、精确率(precision)、召回率(recall)、准确率(accuracy)

1、精确率(查准率):计算预测出来的某类样本中,有多少是被正确预测的。即表示的是预测为正的样本中有多少是真正的正样本。针对预测样本而言。

2、召回率(查全率):有多少样本被正确的预测出来了,即该类样本有多少被找出来(召回了多少)。即表示的是样本中的正例有多少被预测正确了。针对原先实际样本而言。

3、准确率:正类和负类预测准确的比例。在正例较少负例较多的不平衡分类问题(疾病;恐怖分子)中,存在着如果把所有数据全部预测为负例,准确率依然会很高的问题,所以引入召回率。
  根据多分类结果,可以根据样本的预测结果是否正确来形成混淆矩阵。
在这里插入图片描述
(1)加权准确率(Weighted Accuracy,WA
在这里插入图片描述
(2)非加权准确率(Unweighted Accuracy,UA
在这里插入图片描述

精确率

  • 18
    点赞
  • 108
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

少年龙龙

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值