论文阅读 - 《Relation Classification via Multi-Level Attention CNNs》

最新推荐文章于 2024-04-29 11:29:52 发布

时光杂货店

最新推荐文章于 2024-04-29 11:29:52 发布

阅读量6.4k

点赞数 3

分类专栏： nlp 文章标签：论文关系提取 attention

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xg123321123/article/details/53163257

版权

作者：xg123321123出处：http://blog.csdn.net/xg123321123/article/details/553163257声明：版权所有，转载请联系作者并注明出处1 问题定义关系提取用于从文本中抽取结构化事实。2 背景综述3 方法概述将attention机制加入到神经网络中，对于反映实体关系更重要的词语给予更大的权重，辅以改进后的目标函数，从而提高关系提取的效果。整体

摘要由CSDN通过智能技术生成

作者：xg123321123

出处：http://blog.csdn.net/xg123321123/article/details/553163257

声明：版权所有，转载请联系作者并注明出处

1 问题定义

关系提取用于从文本中抽取结构化事实。

2 背景综述

除了少数无监督方法，大部分方法都是将关系提取转化为多分类问题来做；
传统的基于特征的方法要么依赖于手工提取的特征，要么依赖于精心设计的kernel，这些方法不仅容易出错，提取特征的能力也是有限的，当应用到新的领域时不够鲁棒；
近年来出现的神经网络模型取得了一定成果，但模型较为复杂，要么是需要外部依赖，要么是需要训练多个子模型。

3 灵感来源

现实世界中，同一关系可以被表达为很多种形式，这就要求模型不仅得考虑词级信息，还得考虑句级和语义级别的信息；
有很多手工设计提取特征的模型；
也有一些基于神经网络的模型，但大多需要外部依赖，同时，对于关键信息的捕捉还不理想。

4 方法概述

将attention机制加入到神经网络中，对于反映实体关系更重要的词语给予更大的权重，辅以改进后的目标函数，从而提高关系提取的效果。
整体结构示意图如下：

这里写图片描述

将attention机制应用在输入序列中，用于学习输入语句中各部分对两个实体的注意力；
将attention机制应用在池化层上，用于学习目标类别的注意力；
改进了目标函数，使其在关系提取上表现得更好。

输入表示

对于一个句子 $S=(w_1,w_2,...w_n)$ ,有两个标记的实体 $e_1(w_p)$ 和 $e_2(w_t)$ ，其中 $(p,t \in[1,n], p\neq t)$

先将每个单词转换为真值向量，即将 $w_i$ 表示为 $w_i^d \in T^{d_w}$ ,其中 $d_w$ 是向量的维度；
为了进一步捕获实体之间关系的信息，引入了WPE（word position embeddings），具体来说，就是将每个单词相对于两个实体的距离给保存下来，即将 $w_i$ 表示为 $w_i^M=[(w_i^d)^T,(w_{i,1}^p)^T,(w_{i,2}^p)^T]T$ ，其中 $(w_{i,1}^p)^T,(w_{i,2}^p)^T$ 分别是 $w_i$ 关于实体 $e_1$ 和 e2

最低0.47元/天解锁文章

时光杂货店

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
2
评论
论文阅读 - 《Relation Classification via Multi-Level Attention CNNs》

作者：xg123321123出处：http://blog.csdn.net/xg123321123/article/details/553163257声明：版权所有，转载请联系作者并注明出处1 问题定义关系提取用于从文本中抽取结构化事实。2 背景综述3 方法概述将attention机制加入到神经网络中，对于反映实体关系更重要的词语给予更大的权重，辅以改进后的目标函数，从而提高关系提取的效果。整体
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。