论文笔记整理:余海阳,浙江大学硕士,研究方向为知识图谱、自然语言处理。
链接:https://wvvw.aaai.org/ojs/index.php/AAAI/article/view/4591
动机
之前的联合抽取实体以及实体间的关系的方法,主要是采用管道模型,即先识别出实体,再找出实体间的关系。这样的框架容易推导但易导致错误传播,以及忽略了实体和关系间的内在联系。Copyre的方法采用seq2seq2连续生成三元组的方式进行抽取,却不容易处理当实体是多个多个词组成的情况。本文提出了一种新的统一框架,通过查询次同时对实体和关系进行序列标注的方式联合抽取出三元组。
亮点
与之前的模型相比,我们提出了新的统一框架进行联合抽取。给定一个句子和一个查询位置p,我们的模型将回答两个伪问题:“p处的实体及其类型是什么?”和“ p处的实体与哪个实体有关系?”通过回答这两个问题我们将联合抽取问题转化为序列标注问题,对于n个单词的句子我们根据n个查询位置注释了n个不同的标签序列。为了在单个统一模型中对这n个标记序列建模,我们将一种新颖的位置注意力机制引入序列标记模型以生成n个不同的位置感知语句表示。另外,所提出的注意力机制可以在单词(实体)之间建立直接连接,这可能有助于提取远程关系&#x