共指消解评价指标

最新推荐文章于 2023-10-28 19:02:35 发布

qlzyssm

最新推荐文章于 2023-10-28 19:02:35 发布

阅读量2.3k

点赞数 3

分类专栏： paper note 文章标签：自然语言处理

本文链接：https://blog.csdn.net/qlzyssm/article/details/106925956

版权

本文详细介绍了共指消解任务的四个关键评价指标：MUC、B3、CEAF和BLANC，讨论了它们的计算方法和优缺点，为自然语言处理中的共指消解提供了评估标准。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

一、简介
二、MUC
三、B³
四、CEAF
五、BLANC
六、参考文献

一、简介

本篇博文主要介绍共指消解任务中常用的评价指标：MUC，B³，CEAF，以及BLANC。在实际应用中，通过采用上述评价指标的多种的平均值作为最终的评估指标。

二、MUC

MUC score计算了将预测的共指链映射到标注的共指链所需插入或者删除的最少的链接数量。其缺陷在于无法衡量系统预测单例实体（singleton entity）的性能。

三、B³

B³算法可以克服MUC的缺点，因为该算法主要是对每个mention来分别计算precision和recall，然后以所有mention的平均值作为最终的指标。

对于单个mention，计算方式如下所示：
在这里插入图片描述
其中，R代表算法预测的共指链，而K则代表数据集标注的共指链。

计算样例：
在这里插入图片描述

四、CEAF

CEAF是一种基于实体相似度的评估算法。对于实

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qlzyssm

关注关注

3
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

(2020)End-to-end Neural Coreference Resolution论文笔记

zik的博客

05-14

1460

我们介绍了第一个端到端共指消解模型，并表明它在不使用句法解析器或手工设计的提及检测器的情况下显著优于以前的所有工作。关键思想是直接将文档中的所有跨域视为潜在的提及，并了解每个跨域可能的前件的分布。该模型计算将上下文相关的边界表示与首部寻找注意力机制相结合的跨度嵌入。它被训练为最大限度地从共指簇中获得Gold先行词跨度的边际可能性，并被分解为能够积极地剪枝潜在提及。

基于普通RNN、LSTM、加入atttention的LSTM的指代消解【代码在文末】

zik的博客

06-10

568

setlength{\parindent}{0cm}%取消首行缩进\textbf{摘要：}本文简单利用了基于普通RNN、LSTM和加入atttention的LSTM的神经网络来完成指代消解任务。首先本文对指代消解任务进行了一个简要的介绍。其次分别给出了RNN、LSTM和加入atttention的LSTM的框图、机理分析以及测试分析。第三是对比三种模型训练时梯度消失的情况和在指代消解任务上的性能对比。最后关于此次实践作业做了一个总结。\textbf{关键词：}普通RNN;LSTM;

1 条评论您还未登录，请先登录后发表或查看评论

指代消解评价指标(共指消解评测算法)

Tian的博客

11-06

2679

共指消解的评价方法和算法非常重要,它不但可以给出不同系统之间性能优劣的指标,同时能为进一步提高系统性能指明方向。一个好的用于评价共指消解性能的标准应该具备两点一是辨别能力二是解释能力。前者是指能够判断出系统共指关系消解处理好坏的能力后者是指具备对评价结果合理直观解释的能力。 MUC评测算法 MUC-6算法是一种基于链(link-based)的评价标准算法,曾广泛用于MUC会议的指代消解任务。算法定...

共指消解评测方法详解与python实现

weixin_44826203的博客

10-26

2646

共指消解任务中，常见评测指标（MUC，B3，CEAF、BLANC等）计算方法介绍，及python版代码实现。

事件共指消解调研

qq_29496135的博客

02-09

2147

本篇博文是对事件共指关系消解的调研记录，后续将会补充事件共指消解系列论文研读笔记。

关于共指消解中特征的选取和计算

Rya的专栏

09-08

1730

Normal 0 7.8 磅 0 2 false false false MicrosoftInternetExplorer4 <!-- /* Font

NLP实践——中文指代消解方案

最新发布

weixin_44826203的博客

10-28

3631

本文介绍如何使用经典的s2e-coref方法，在Ontonotes 5.0数据集上训练一个中文实体共指模型，主要介绍训练和推理方法。

人工智能专栏第十一讲——指代消歧

记录 IT 领域经验与见解的博客

05-22

937

但是，在处理自然语言文本时，计算机往往难以准确地理解代词所指的对象，因为同一个代词可能指代不同的对象，或者不同的代词可能指代同一个对象。然而，对于有一定编程和数学基础的新手，通过学习相关的基础概念和方法，是有可能理解和应用指代消歧技术的。总之，指代消歧是自然语言处理领域的一个重要问题，它可以帮助计算机正确理解自然语言文本中的代词指向，从而提高自然语言处理系统的准确性和效率。基于机器学习的方法的优点是可以自动从大量的文本中学习规律和知识，从而实现自动化的指代消歧，而且可以处理一些复杂的语言现象。

共指消解自我总结-初级

Wywxring98的博客

12-20

2016

文章目录入门定义术语分类面向实体共指消解的机器学习综述评价指标应用场景共指消解任务定义分析ModelSpan RepresentationPractical ImplementationResultMethodsHobbs’ naive algorithm (1976)中心理论对数线性模型Simple neural networkMention-Pair ModelEnd-to-end Neural Coreference Resolution (Lee et al., EMNLP 2017)A Large

Coreference Resolution (共指消解)

疯子的专栏

10-14

5179

前言本科时候主要搞的是利用深度学习来做文本分类和情感分析，phd期间的老板貌似对deep learning和一些相关的应用不是太感兴趣，于是。。我就跳进了coreference resolution这个坑（此处省略1万字）定义相信很多人都没有听说过这个概念，所以先在这里简单的介绍一下基本的定义： Coreference resolution (共指解析)是自然

AAAI2019_A Hierarchical Multi-task Approach for Learning Embeddings from Semantic Tasks

All in.的博客

07-07

897

文章目录摘要介绍模型Words embeddingsNER实体提及检测(EMD)共指消解(CR)关系抽取 (RE)实验设置数据集和评估指标论文摘要为了评估是否可以利用多任务学习来学习可用于各种自然语言处理(NLP)下游应用的丰富表示，已经投入了大量的工作。然而，目前仍缺乏对多任务学习产生显著影响的背景的了解。在这一工作中，我们引入了一个分层模型，该模型在一组精心选择的语义任务上进行多任务学习。通过监督模型底层的一组低级任务和顶层的一组较复杂的任务，以分层的方式进行训练，引入归纳偏差。该模型在许

Coreference resolution (共指解析)

github_36088377的博客

09-10

1万+

指代消解_Cluster-Pair Encoder

Wangxs

08-12

563

理解：利用了两个mention簇ci，，并用γc(ci,cj)进行分布式表示。接着cluster-pair 编译器首先通过池化层操作，合并了mention-pair Representations矩阵中包含的信息，来产生γc(ci,cj)。特别的是，这步的池化操作，能够同时连接最大池和平均池的结果，它比单独使用任何一个更有效。其中：这里的γm( )就是隐藏层的...

指代消解系列（1）-综述

热门推荐

锦年的博客

06-16

1万+

一、什么是指代消解？1、指代的基本概念指代作为一种常见的语言现象，广泛存在于自然语言的各种表达中。eg:***俄罗斯总统*** 在德国发表讲话时表示：“我们不排除中油集团参与已拍卖的尤甘斯克的生产。”***他*** 表示，中油集团没有参加这次拍卖一般代词消解和早期的指代消解（Anaphora Resolution）指的是对显性代词消解算法的研究，再后来指代消解包含并开始侧重于共指(Corefe

指代消解笔记

Tian的博客

10-25

1万+

基础原理: 共指消解技术主要用于解决多个指称对应同一实体对象的问题。在一次会话中，多个指称可能指向的是同一实体对象。利用共指消解技术，可以将这些指称项关联（合并）到正确的实体对象，由于该问题在信息检索和自然语言处理等领域具有特殊的重要性，吸引了大量的研究努力。共指消解还有一些其他的名字，比如对象对齐、实体匹配和实体同义。 共指消解问题的早期研究成果主要来自自然语言处理领域，近年来统计机器学习领域的...

命名实体识别的评价指标

li_qili_qi的博客

12-25

6688

正确率、召回率、F1值准确率（正确率）=所有预测正确的样本/总的样本（TP+TN）/总精确率=将正类预测为正类 / 所有预测为正类 TP/（TP+FP）召回率 = 将正类预测为正类 / 所有真正的正类 TP/（TP+FN） F值 = (精确率 * 召回率 * 2) / ( 精确率 + 召回率) （F 值即为精确率和召回率的调和平均值）正确率：识别出正确的实体数...

自然语言处理当中评价指标汇总

极客梦的专栏

05-11

1万+

自然语言处理当中评价指标很多，好多专用的术语，本篇旨在对常用的评价指标汇总，督促自己系统学习，大家当做参考不足之处请指出并做交流。文本分类评测指标如下： P-R曲线的比较：对于A和B曲线，如果需要比较，比较两个曲线的轮廓的面积. 宏观和微观评价指标 ROC与AUC曲线机器翻译当中的评价指标BLEU：对机器翻译作人工评价时会考量到翻译的许多方面：如机器的充分性、忠实度和流

衡量机器学习模型的三大指标：准确率、精度和召回率

weixin_30415801的博客

12-14

1348

　转载自https://mp.weixin.qq.com/s/rXX0Edo8jU3kjUUfJhnyGw 倾向于使用准确率，是因为熟悉它的定义，而不是因为它是评估模型的最佳工具！精度（查准率）和召回率（查全率）等指标对衡量机器学习的模型性能是非常基本的，特别是在不平衡分布数据集的案例中，在周志华教授的「西瓜书」中就特别详细地介绍了这些概念。　　什么是分布不平衡的数据...

命名实体识别评估指标

一万年太久，只争朝夕

10-12

1万+

对命名实体识别系统的发展来说，对系统的全面评估是必不可少的，许多系统被要求根据它们标注文本的能力来对系统进行排序。目前，通常采用的评估指标主要有正确率、召回率和F值，它们的定义如下：正确率 = 识别出的正确实体数 / 识别出的实体数召回率 = 识别出的正确实体数 / 样本的实体数两者的取值都在 0 和 1 之间，数值越接近1，正确率或召回率就越高。正确率和召回率有时会出现矛盾的情况，这是需要综合考