关系抽取中分类评价指标

本文介绍了关系抽取中常用的评价指标,包括准确率、精确率、召回率、F-score,以及P-R曲线和ROC-AUC曲线。强调在类别不平衡时,这些指标的重要性,特别是F1-score和ROC-AUC曲线,因为它们不依赖于阈值设定,能更好地衡量模型性能。
摘要由CSDN通过智能技术生成

新年第一篇博客~~,也是人生第一篇博客,愿能够坚持下去。
最近做关系抽任务时在评价指标方面遇到了一些问题,因此对分类评价指标进评价指标重新进行了学习,在此做个简单的总结。评价指标一般是指是对机器学习模型算法和参数好坏的一种定量评价方法,目前大部分评价指标——不管是准确率还是f值都只能片面反应模型的效果,所以如何运用评价指标就显得尤为重要,往往需要多种评价指标综合运用。

1 关系抽取中的主要评价指标

在关系抽取中我们常用的评价指标一般有准确率(Accuracy)、精确率(Precision)、召回率(Recall),F-score,pr曲线,ROC-AUC曲线等。

2 混淆矩阵

在介绍评价指标前,先回忆下一个简单的概念——混淆矩阵。在做分类任务时,预测结果和真实情况之间存在四种不同的组合:TPFPFNTN,这四种组合构成了混淆矩阵,如下图所示:

在这里插入图片描述
其中:

  • TP(真正例):预测为正的正样本
  • FP(假正例):预测为正的负样本
  • FN(假负例):预测为负的正样本
  • TN(真负例):预测为负的负样本

3 准确率

准确率是最常见和最简单的评价方法,简单来说预测正确的样本数量和所有样本数量之比,也可以用如下公式表示,需要注意的是不要和精确率(Precision)弄混。准确率评价算法有一个明显的弊端问题,就是在数据的类别不均衡,特别是有极偏的数据存在的情况下,准确率这个评价指标是不能客观评价算法的优劣的,比如正负比例99:1, 只要把所有样本预测为负例,模型就能达到0.99的效果,显然是不合理的。
在这里插入图片描述

  • 6
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值