联合信息抽取2021-2022年CCF A B类论文总结

关键词"Joint extraction"

目录

1 论文 Multi-head Attention with Hint Mechanisms for Joint Extraction of Entity and Relation (具有提示的多头注意机制,用于实体和关系的联合提取) CCF B

2 论文 PRGC: Potential Relation and Global Correspondence Based Joint Relational Triple Extraction ( PRGC: 基于潜在关系和全局对应关系的联合关系三重提取) CCF A

3 论文 Incorporating Bidirection-Interactive Information and Semantic Features for Relational Facts Extraction (Student Abstract) (结合双向交互信息和语义特征进行关系事实提取(学生摘要)) CCF A

4 论文 A survey on extraction of causal relations from natural language text(自然语言文本因果关系抽取研究) CCF B

5 论文: OneRel:  Joint Entity and Relation Extraction with One Module in One Step (OneRel:一步完成一个模块的联合实体和关系提取)CCF A

6 论文: TDEER: An Efficient Translating Decoding Schema for Joint Extraction of Entities and Relations (TDEER:一种用于联合提取实体和关系的高效翻译解码模式) CCF B

7 论文: Joint extraction of entities and relations via an entity correlated attention neural model (通过实体相关注意神经模型联合提取实体和关系) CCF B

8 论文: A Unified Multi-Task Learning Framework for Joint Extraction of Entities and Relations (用于联合提取实体和关系的统一多任务学习框架) CCF A


1 论文 Multi-head Attention with Hint Mechanisms for Joint Extraction of Entity and Relation (具有提示的多头注意机制,用于实体和关系的联合提取) CCF B

        摘要:在本文中,我们提出了一种从原始文本中联合提取实体和关系的模型,而不像以前的研究那样依赖额外的 NLP 特征、参数阈值调整或实体关系模板。我们的联合模型结合了用于实体识别的语言建模和用于关系提取的多头注意力。此外,我们利用两种提示机制来提高多头注意力的收敛速度和关系提取的 F1 分数。广泛的实验结果表明,我们提出的模型通过在各种数据集上具有更高的 F1 分数而显着优于基线。我们还提供消融测试来分析我们模型中组件的有效性。

论文链接:Multi-head Attention with Hint Mechanisms for Joint Extraction of Entity and Relation | SpringerLink

cite this paper:

Fang, CH., Chen, YL., Yeh, MY., Lin, YS. (2021). Multi-head Attention with Hint Mechanisms for Joint Extraction of Entity and Relation. In: , et al. Database Systems for Advanced Applications. DASFAA 2021 International Workshops. DASFAA 2021. Lecture Notes in Computer Science(), vol 12680. Springer, Cham. https://doi.org/10.1007/978-3-030-73216-5_22

2 论文 PRGC: Potential Relation and Global Correspondence Based Joint Relational Triple Extraction ( PRGC: 基于潜在关系和全局对应关系的联合关系三重提取) CCF A

摘要:从非结构化文本中联合提取实体和关系是信息提取中的一项关键任务。最近的方法取得了可观的性能,但仍然存在一些固有的局限性,例如关系预测的冗余、基于跨度的提取的泛化能力差和效率低下。在本文中,我们从新颖的角度将该任务分解为三个子任务,关系判断、实体提取和主客对齐,然后提出了一种基于潜在关系和全局对应关系(PRGC)的联合关系三元组提取框架。具体来说,我们设计了一个组件来预测潜在关系,它将以下实体提取限制为预测的关系子集而不是所有关系;然后应用关系特定的序列标记组件来处理主体和对象之间的重叠问题;最后,设计了一个全局对应组件,将主客体对齐成一个低复杂度的三元组。大量实验表明,PRGC 在公共基准测试中以更高的效率实现了最先进的性能,并在重叠三元组的复杂场景中提供了一致的性能增益。

论文链接:https://arxiv.org/abs/2106.09895

cite this paper:

Zheng, Hengyi, et al. "PRGC: Potential relation and global correspondence based joint relational triple extraction." arXiv preprint arXiv:2106.09895 (2021).

3 论文 Incorporating Bidirection-Interactive Information and Semantic Features for Relational Facts Extraction (Student Abstract) (结合双向交互信息和语义特征进行关系事实提取(学生摘要)) CCF A

        摘要:命名实体识别和关系分类之间的交互对于关系三元组的提取非常重要。然而,大多数联合提取工作只考虑两个子任务之间的单向交互。他们甚至完全忽略了交互信息。为了解决这些问题,我们提出了一种新颖的统一联合提取模型,该模型考虑了两个子任务之间的双向交互信息。我们的模型由两个模块组成。第一个模块利用 Bi-LSTM 和 GCN 来捕获句子的顺序和结构语义特征,第二个模块利用两个层来捕获两个子任务之间的双向交互信息,并分别生成关系三元组。实验结果表明,我们提出的模型在两个公共数据集上优于最先进的模型。

论文链接: https://ojs.aaai.org/index.php/AAAI/article/download/17970/17775

cite this paper:

Yu Y, Wang G, Ren H, et al. Incorporating bidirection-interactive information and semantic features for relational facts extraction (student abstract)[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2021, 35(18): 15947-15948.

4 论文 A survey on extraction of causal relations from natural language text(自然语言文本因果关系抽取研究) CCF B

        摘要:作为人类认知的重要组成部分,因果关系经常出现在文本中,从文本中整理因果关系有助于构建预测任务的因果网络。现有的因果关系提取技术包括基于知识、基于统计机器学习 (ML) 和基于深度学习的方法。每种方法都有其优点和缺点。例如,基于知识的方法是可以理解的,但需要大量的人工领域知识,跨领域适用性较差。由于自然语言处理 (NLP) 工具包,统计机器学习方法更加自动化。然而,特征工程是劳动密集型的,工具包可能会导致错误传播。在过去的几年里,深度学习技术因其强大的表示学习能力和计算资源的快速增长而引起了 NLP 研究人员的大量关注。它们的局限性包括高计算成本和缺乏足够的带注释的训练数据。在本文中,我们对因果关系提取进行了全面调查。我们首先介绍了因果关系提取中存在的主要形式:显式句内因果关系、隐式因果关系和句间因果关系。接下来,我们列出了用于因果关系提取的基准数据集和建模评估方法。然后,我们对这三种技术及其代表系统进行了结构化概述。最后,我们强调了现有的开放挑战及其潜在方向。

论文链接:A survey on extraction of causal relations from natural language text | SpringerLink

cite this paper:

Yang J, Han S C, Poon J. A survey on extraction of causal relations from natural language text[J]. Knowledge and Information Systems, 2022: 1-26.

5 论文: OneRel:  Joint Entity and Relation Extraction with One Module in One Step (OneRel:一步完成一个模块的联合实体和关系提取)CCF A

        摘要:联合实体和关系抽取是自然语言处理和知识图谱构建中的一项重要任务。现有方法通常将联合提取任务分解为几个基本模块或处理步骤,以使其易于执行。然而,这样的范式忽略了三元组的三个元素相互依存且不可分割的事实。因此,以前的联合方法存在级联错误和冗余信息的问题。为了解决这些问题,在本文中,我们提出了一种新的联合实体和关系提取模型,名为 OneRel, 它将联合提取作为细粒度的三元分类问题。具体来说,我们的模型由基于评分的分类器和特定关系的角标记策略组成。前者评估标记对和关系是否属于事实三元组。后者确保了简单但有效的解码过程。在两个广泛使用的数据集上的广泛实验结果表明,所提出的方法比最先进的基线表现更好,并且在各种重叠模式和多个三元组的复杂场景中提供一致的性能增益。

论文链接:Sign in to EndNote Click

cite this paper:

Shang Y M, Huang H, Mao X. OneRel: Joint Entity and Relation Extraction with One Module in One Step[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2022, 36(10): 11285-11293.

6 论文: TDEER: An Efficient Translating Decoding Schema for Joint Extraction of Entities and Relations (TDEER:一种用于联合提取实体和关系的高效翻译解码模式) CCF B

        摘要:从非结构化文本中联合提取实体和关系以形成事实三元组是构建知识库 (KB) 的一项基本任务。一种常见的方法是通过预测实体对来解码三元组以获得对应关系。然而,有效地处理这项任务仍然具有挑战性,特别是对于重叠三重问题。为了解决这个问题,本文提出了一种新的高效实体和关系提取模型,称为 TDEER,它代表 Translating Decoding Schema for Joint Extraction of Entities and Relations。与常用方法不同,所提出的翻译解码模式将关系视为从主体到客体的翻译操作,即 TDEER 将三元组解码为主体 + 关系 → 客体。 TDEER 可以自然地处理重叠三元组问题,因为翻译解码模式可以识别所有可能的三元组,包括重叠和非重叠三元组。为了增强模型的鲁棒性,我们引入负样本来减轻不同阶段的误差累积。对公共数据集的广泛实验表明,与最先进的 (SOTA) 基线相比,TDEER 产生了具有竞争力的结果。此外,计算复杂度分析表明 TDEER 比强大的基线更有效。特别是,提出的 TDEER 比最近的 SOTA 模型快 2 倍。该代码可在 https://github.com/4AI/TDEER 获得。

论文链接:TDEER: An Efficient Translating Decoding Schema for Joint Extraction of Entities and Relations - ACL Anthology

cite this paper:

Li X, Luo X, Dong C, et al. TDEER: an efficient translating decoding schema for joint extraction of entities and relations[C]//Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing. 2021: 8055-8064.

7 论文: Joint extraction of entities and relations via an entity correlated attention neural model (通过实体相关注意神经模型联合提取实体和关系) CCF B

        摘要:命名实体识别和关系提取是自然语言处理中的关键任务。由于传统的流水线方式可能会遇到错误传播问题并忽略底层交互,因此实体和关系的联合提取已成为主流趋势。然而,现有联合提取模型的性能需要改进。本文提出了一种两阶段标记方案,分别标记特定关系中的候选头部实体和多个尾部实体。接下来,它提出了一种基于实体优先标记策略的新型轻量级联合提取神经模型。在所提出的模型中,基于 BiLSTM 的编码器结合了隐藏状态和全局上下文特征,并将它们作为接下来两个实体标记任务的输入。进一步地,在混合上下文表示的输入下,候选头实体识别模块被用来识别候选头实体,而多尾实体识别模块配备实体相关的注意力机制来识别对应的头实体。特定头部实体下的尾部实体。对两个广泛使用的英文数据集和一个自建的中文数据集进行了综合实验。实验结果表明,该模型在关系提取任务中优于基线方法,并通过轻量级架构实现了具有竞争力的实体识别效果。

论文链接:https://www.sciencedirect.com/science/article/pii/S0020025521009592?casa_token=HWqJca4hIXgAAAAA:gjtBuC3p5YthIGlrVCX6EMYkZfxgVG0HcXlDc8H0DjjGBf1I2-hV2r62nKn2tCgBrOqWoUgkGg

cite this paper:

Li R, Li D, Yang J, et al. Joint extraction of entities and relations via an entity correlated attention neural model[J]. Information Sciences, 2021, 581: 179-193.

8 论文: A Unified Multi-Task Learning Framework for Joint Extraction of Entities and Relations (用于联合提取实体和关系的统一多任务学习框架) CCF A

        摘要:实体和关系的联合提取侧重于使用统一模型同时检测实体对及其关系。基于提取顺序,以前的工作主要通过关系后、关系优先和关系中间的方式来解决这个任务。然而,这些方法仍然存在模板依赖、非实体检测和非预定义关系预测问题。为了克服这些挑战,在本文中,我们提出了一个统一的多任务学习框架,将任务划分为三个交互的子任务。具体来说,我们首先介绍了主题提取的类型注意方法,以显式地提供先验类型信息。然后,提出了主题感知关系预测,以基于全局和局部语义的组合来选择有用的关系。第三,我们提出了一种基于问题生成的对象提取 QA 方法,以自动获得不同的查询。值得注意的是,我们的方法在不依赖 NER 模型的情况下检测主题或对象,因此它能够处理非实体场景。最后,通过参数共享将三个子任务整合为一个统一的模型。大量实验表明,所提出的框架在两个基准数据集上优于所有基线方法,并进一步实现了非预定义关系的出色性能。

论文链接:A Unified Multi-Task Learning Framework for Joint Extraction of Entities and Relations | EndNote Click

cite this paper:

Zhao T, Yan Z, Cao Y, et al. A Unified Multi-Task Learning Framework for Joint Extraction of Entities and Relations[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2021, 35(16): 14524-14531.

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值