评测通知 | NLPCC2024评测任务:名词短语指代链抽取

61bf5ad26226cd0c468522dcd0b88de4.png

评测通知 | NLPCC2024评测任务:名词短语指代链抽取

  • 评测任务介绍: https://ncce-site.pages.dev/registration

  • 数据和基线模型: https://ncce-site.pages.dev/dataset

  • 预测结果提交: https://www.codabench.org/competitions/3179

1. 赛事背景

本次挑战赛聚焦名词短语链抽取,通过对文档中名词短语的识别和聚类,实现对提及相同话题或语义相关的名词短语的准确抽取和聚类。挑战赛旨在促进相关领域学者的交流合作,推动汉语篇章理解技术的发展。

“2024 名词短语链抽取(Nominal Compound Chain Extraction, NCCE)挑战赛”已经开启报名。竞赛最终排名靠前的参赛者将收到NLPCC提供的获奖证明,并有机会撰写技术论文投稿发表至NLPCC 2024 Shared Task Track

2. 比赛详情

评测任务基于篇章级名词短语链数据集,此数据集文档的主题为突发事件、时政消息等,共包括2450篇中文文档,约2.6万个名词短语和5千条共指代链。

词汇链是指篇章中的名词通过共指、上下位等关系组合成若干条链,可以有效增强对于篇章语义和线索的理解。传统的词汇链涉及的词汇较短,由此形成的词汇链无法准确描述相关的名词在篇章中的演化规律。为此,我们提出了篇章级的名词短语链抽取任务,旨在识别出篇章中的最长名词短语及其组成的链条。

如下所示:图中标注为同一颜色的名词短语可以组成同一条链。本次评测任务鼓励参赛者识别出名词短语,并且判断其依赖关系,最终组成若干条名词短语链。

61b86e49072b4997b07535de14b2b18a.png

本任务可以分为两个阶段执行:

第一阶段:名词短语识别
给定一篇文章,需要模型从中识别出所有最长名词短语。

第二阶段:名词短语链识别
根据给定的文档和抽取出的名词短语,识别出具有语义相关关系的名词短语,进而组成若干条链。

从形式上看,本任务类似于指代消解;从内涵上看,与指代消解有所不同,后者倾向于识别唯一指代的名词实体组成一条链,本任务中链的确定是基于名词语义相关关系,且本任务涉及的是最长名词短语而非较短的名词实体,因而更具有挑战性。

3. 时间节点

  • 2024年3月25日:训练集发布

  • 2024年6月11日:注册截止

  • 2024年6月11日:测试集发布,开放提交预测结果

  • 2024年6月20日:提交预测结果截止

  • 2024年6月30日:测试集标签发布,开放投稿

  • 2024年7月20日:投稿截止

4. 参赛步骤

  1. 任务网站注册

    填写报名表:https://ncce-site.pages.dev/registration

  2. 获取数据

    数据和基线模型:https://ncce-site.pages.dev/dataset

  3. 评测系统提交

    提交预测结果:https://www.codabench.org/competitions/3179

5. 组织者

  • 费豪,新加坡国立大学

  • 李波波,武汉大学

  • 姬东鸿,武汉大学


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值