多分类f1分数_多分类的评价指标PRF(Macro-F1/MicroF1/weighted)详解

也许是由于上学的时候一直搞序列标注任务,多分类任务又可以简化为简单的二分类任务,所以一直认为PRF值很简单,没啥好看的。然鹅,细看下来竟有点晦涩难懂,马篇博留个念咯~

前言

PRF值分别表示准确率(Precision)、召回率(Recall)和F1值(F1-score),有机器学习基础的小伙伴应该比较熟悉。

根据标题,先区别一下“多分类”与“多标签”:

多分类:表示分类任务中有多个类别,但是对于每个样本有且仅有一个标签,例如一张动物图片,它只可能是猫,狗,虎等中的一种标签(二分类特指分类任务中只有两个类别)

多标签:一个样本可以有多个标签。例如文本分类中,一个文本可以是宗教相关,也可以是新闻相关,所以它就可以有两个标签

此处只介绍多分类任务的评价指标~

混淆矩阵与PRF值

1. 混淆矩阵

混淆矩阵是数据科学和机器学习中经常使用的用来总结分类模型预测结果的表,用n行n列的矩阵来表示,将数据集中的记录按照真实的类别和预测的类别两个标准进行汇总。以二分类任务为例,混淆矩阵的结构如下:

混淆矩阵

预测

真(正)

假(负)

实际

真(正)

TP

FN

假(负)

FP

TN

其中:

TP——将正类预测为正类的个数

FN——将正类预测为负类的个数

FP——将负类预测为正类的个数

TN——将负类预测为负类的个数

2. 传统的PRF值公式<

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在上面的例子中,假设我们有一个二分类任务,分类目标是判断一封电子邮件是垃圾邮件(正例)还是非垃圾邮件(负例)。我们有以下混淆矩阵: 预测为垃圾邮件 预测为非垃圾邮件 真实值为垃圾邮件 20 10 真实值为非垃圾邮件 5 65 基于这个混淆矩阵,我们可以计算以下分类模型评价指标: 1. 准确率(Accuracy): 准确率表示正确预测的样本数与总样本数的比例。 准确率 = (TP + TN) / (TP + TN + FP + FN) 其中,TP表示真正例(真实为垃圾邮件,预测也为垃圾邮件)的数量,TN表示真负例(真实为非垃圾邮件,预测也为非垃圾邮件)的数量,FP表示假正例(真实为非垃圾邮件,但预测为垃圾邮件)的数量,FN表示假负例(真实为垃圾邮件,但预测为非垃圾邮件)的数量。 2. 召回率(Recall): 召回率表示预测为正例的样本中,真正例的比例。 召回率 = TP / (TP + FN) 3. 精确率(Precision): 精确率表示真正例在所有预测为正例的样本中的比例。 精确率 = TP / (TP + FP) 4. F1分数F1-score): F1分数综合考虑了精确率和召回率,是二者的调和平均值。 F1分数 = 2 * (精确率 * 召回率) / (精确率 + 召回率) 根据上述混淆矩阵,可以计算出: - 准确率 = (20 + 65) / (20 + 65 + 10 + 5) - 召回率 = 20 / (20 + 10) - 精确率 = 20 / (20 + 5) - F1分数 = 2 * (20 / (20 + 5) * 20 / (20 + 10)) / (20 / (20 + 5) + 20 / (20 + 10)) 请注意,这里的例子是二分类任务的评价指标计算,对于多分类任务,评价指标的计算方式可能会有所不同。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值