Joint entity recognition and relation extraction as a multi-head selection problem

最新推荐文章于 2023-06-24 20:48:47 发布

「已注销」

最新推荐文章于 2023-06-24 20:48:47 发布

阅读量684

点赞数

分类专栏：论文笔记文章标签：自然语言处理知识图谱深度学习

本文链接：https://blog.csdn.net/Jeaksun/article/details/125340253

版权

论文笔记专栏收录该内容

59 篇文章 5 订阅

订阅专栏

该文提出了一种新颖的模型，用于无需依赖NLP工具的实体识别和关系抽取。模型通过CRF进行实体识别，并将关系抽取视为多头选择问题，允许每个实体与多个其他实体建立关系。使用Bi-LSTM获取上下文信息，然后通过共享参数的方式进行关系抽取。在不使用BERT的情况下，在ACE04数据集上取得了出色成绩，证明了该方法的有效性。

摘要由CSDN通过智能技术生成

在这里插入图片描述

Abstract

实体识别和关系抽取比较依赖NLP工具（词性标记POS、依赖关系等），本文提出一种不需要人工或工具提取特征并且能同时进行实体和关系等候区的模型，即使用CRF抽取实体，将关系抽取看做多头选择问题，为每一个实体识别潜在的多种关系（实体重叠）。

Model

在这里插入图片描述
本文将联合关系抽取建模为一项多头选择问题（一个特定的实体可能涉及到与其他实体的多种关系），模型能够同时识别实体（类型和边界）以及它们之间的关系。

Embedding Layer
- 将word进行词嵌入
Bi-LSTM Encoder Layer
- 得到双向的信息： $h_i=[\overset{\rightarrow}{h_i};\overset{\leftarrow}{h_i}]$
Named Entity Recognition
- 计算每个实体 $w_i$ 对应的所有标签得分： $s^e(h_i)=v ^ef(U^eh_i+b^e)$
- $f$ 表示激活函数， $V^e\in R^{p\times l},U^e\in R^{l\times 2d},p$ 是识别的标签个数
- 给定的token $w_i$ 的候选tags的概率： $Pr(tag|w_i) = \text{softmax}(s(h_i))\in R^p$
- 采用共享参数的方式进行关系抽取，即使用实体标签作为输入，输入到关系提取层学习标签嵌入，因此关系抽取层的输入由两个：
  - LSTM的输出 $h_i$ ，学习到的标签嵌入表示 $g_i$
  - $z_i=[h_i;g_i]$
Relation Extraction as Multi-head Selection
- 采用多头选择时，为了避免造成信息冗余，只判断每个实体的最后一个token与其他实体的最后一个token的关系，而每体的最后一个token被称为head
- 对于每个head，需要预测二元组 $(\overset{\wedge}{y_i},\overset{\wedge}{c_i})$ ，其中前者代表头实体（subject），后者是关系
  - 给定一个序列 $w$ 和一个关系标签 $\mathcal{R}$ 作为输入，目标是为每个token $w_i$ 标识最有可能的head和最有可能的对应关系标签 $\overset{\wedge}{r_i} \in \mathcal{R}$
  - 给定标签 $r_k$ 的情况下，计算 $w_i$ 和 $w_j$ 之间的分数为： $s^r=V^rf(U^rz_j+W^rz_i+b^r)$
  - 将分数映射成概率: $Pr(head=w_j,label=r_k|w_i)=\sigma(s^r(z_j,z_i,r_k))$