论文阅读 - 《Relation Classification via Multi-Level Attention CNNs》

最新推荐文章于 2024-04-29 11:29:52 发布

时光杂货店

最新推荐文章于 2024-04-29 11:29:52 发布

阅读量6.5k

点赞数 3

分类专栏： nlp 文章标签：论文关系提取 attention

本文链接：https://blog.csdn.net/xg123321123/article/details/53163257

版权

本文探讨了一种结合多级注意力机制的卷积神经网络模型用于关系提取，通过分配不同权重给文本中的词语，提高了模型对实体关系的识别效果。模型包括输入级和池化级的注意力机制，并采用改进的目标函数优化关系分类。

摘要由CSDN通过智能技术生成

作者：xg123321123

关系提取用于从文本中抽取结构化事实。

将attention机制加入到神经网络中，对于反映实体关系更重要的词语给予更大的权重，辅以改进后的目标函数，从而提高关系提取的效果。
整体结构示意图如下：

这里写图片描述

输入表示

对于一个句子 $S=(w_1,w_2,...w_n)$ ,有两个标记的实体 $e_1(w_p)$ 和 $e_2(w_t)$ ，其中 $(p,t \in[1,n], p\neq t)$

先将每个单词转换为真值向量，即将 $w_i$ 表示为 $w_i^d \in T^{d_w}$ ,其中 $d_w$ 是向量的维度；
为了进一步捕获实体之间关系的信息，引入了WPE（word position embeddings），具体来说，就是将每个单词相对于两个实体的距离给保存下来，即将 $w_i$ 表示为 $w_i^M=[(w_i^d)^T,(w_{i,1}^p)^T,(w_{i,2}^p)^T]T$ ，其中 $(w_{i,1}^p)^T,(w_{i,2}^p)^T$ 分别是 $w_i$ 关于实体 $e_1$ 和 e2