Modeling Mention Dependencies for Document-Level Relation Extraction

最新推荐文章于 2024-05-08 14:22:56 发布

pig774

最新推荐文章于 2024-05-08 14:22:56 发布

阅读量1.1k

点赞数

分类专栏：论文阅读-NLP 文章标签：自然语言处理人工智能知识图谱

本文链接：https://blog.csdn.net/weixin_62321421/article/details/123401406

版权

论文阅读-NLP 专栏收录该内容

6 篇文章 2 订阅

订阅专栏

Entity Structure Within and Throughout: Modeling Mention Dependencies for Document-Level Relation Extraction

http://arxiv.org/abs/2102.10249

Entity Structure Within and Throughout: Modeling Mention Dependencies for Document-Level Relation Extraction

1 摘要

2 方法

2.1 Entity Structure

2.2 SSAN (Structured Self-Attention Network)

2.2.1 目的

2.2.2 步骤

2.3 Transformation Module

2.3.1 目的

2.3.2 步骤

2.4 SSAN for Relation Extraction

1 摘要

实体-作为文档级关系抽取的必要元素，存在某种结构。为了更好地获取实体的结构信息，在这个框架中，我们定义了各种提及的依赖关系。为此，我们提出了SSAN模型，将这种依赖结构纳入self-attention mechanism，对传统的自注意力机制进行了修改，得到一个新型的自注意力机制，使提及之间产生依赖性。该新型的自注意力机制贯穿整个编码阶段，从而得到信息更加丰富的实体的embedding，从而进行关系抽取任务。

2 方法

2.1 Entity Structure

实体结构描述了实体在文本上的分布以及它们之间的依赖关系。对于实体的提及之间的依赖关系，我们考虑以下两种：

Co-occurrence structure 共现结构：两个提及是否出现在统一句子内
Coreference structure 共指结构：两个提及是否指向同一实体

句内的一个提及与非实体的依赖关系结构为：intraNE

不存在关键的依赖关系：NA

所以，整个结构就形成了一个以实体为中心的邻接矩阵，其所有元素都来自一个有限的依赖集：{intra+coref,inter+coref,in-tra+relate,inter+relate,intraNE,NA}

2.2 SSAN (Structured Self-Attention Network)

an input token sequence x = (x1, x2, ..., xn)

sij ∈ {intra+coref,inter+coref,intra+relate,inter+relate,intraNE,NA}

我们这里用token-level依赖代替了mention-level的依赖，用sij表示token xi 到 token xj 的依赖关系

分为两部分，计算非结构化注意力分数和结构哈注意力分数