PURE(A Frustratingly Easy Approach for Entity and Relation Extraction)

hithithithithit

已于 2022-05-26 22:32:41 修改

阅读量879

点赞数 2

分类专栏： # RE 文章标签：知识图谱人工智能关系抽取自然语言处理 PURE

于 2022-05-25 23:28:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38901850/article/details/124961960

版权

RE 专栏收录该内容

11 篇文章 3 订阅

订阅专栏

写作动机（Movitation）：

假设驱动：作者认为现有的表征仅仅只学习到了实体和上下文之间的联系，并没有学习到实体对之间的依赖关系。

相关工作（Related Work）：

联合学习的子任务：

1.结构化预测问题(将实体抽取和关系抽取两个任务映射到一个联合框架)：

a. 基于动作(action-based)的系统，将新发现的实体链接到之前发现的实体。Incremental Joint Extraction of Entity Mentions and Relationshttps://aclanthology.org/P14-1038.pdf

b. 填表方法(table-filling)

填表方法提出：

Modeling Joint Entity and Relation Extraction with Table Representationhttps://aclanthology.org/D14-1200.pdf End-to-End Neural Relation Extraction with Global Optimizationhttps://aclanthology.org/D17-1182.pdf

Two are Better than One: Joint Entity and Relation Extraction with Table-Sequence Encodershttps://aclanthology.org/2020.emnlp-main.133.pdf

c. 基于序列标注(sequence tagging-based)的方法

Going out on a limb: Joint Extraction of Entity Mentions and Relations without Dependency Treeshttps://aclanthology.org/P17-1085.pdf Joint Extraction of Entities and Relations Based on a Novel Tagging Schemehttps://aclanthology.org/P17-1113.pdf

d. 基于图(graph-based)的方法

Joint Type Inference on Entities and Relations via Graph Convolutional Networkshttps://aclanthology.org/P19-1131/

GraphRel: Modeling Text as Relational Graphs for Joint Entity and Relation Extractionhttps://aclanthology.org/P19-1136.pdf

e. 多轮问答问题(multi-tune qa)

GraphRel: Modeling Text as Relational Graphs for Joint Entity and Relation Extractionhttps://aclanthology.org/P19-1136.pdf

2.多任务学习问题：

a. 序列标注用于实体预测，基于树的LSTM模型用于关系抽取

End-to-End Relation Extraction using LSTMs on Sequences and Tree Structureshttps://aclanthology.org/P16-1105.pdf

b. 将多标签头选择问题转换为模型关系分类

Adversarial training for multi-context joint entity and relation extractionhttps://aclanthology.org/D18-1307v2.pdf

提出的方法（Methods）：

使用两个编码器，一个编码器为实体模型，用于产生给定的span表示来预测实体和实体类型。另一个编码器为关系模型，根据实体模型产生的输出对关系模型的输入进行typed marker（具体来说是给实体加上了实体类型和主客体类型），之后送入关系模型产生实体对之间的表征，再送入前馈神经网络进行分类。此外为了是句子的输入信息更加丰富，在输入端还增加了上下文的词汇。

使用的技术（Techniques）：

模型：使用bert-based-uncased和albert-xxlarge-v1作为两个基础编码器用于对结果进行比较。

损失函数：交叉熵

遇到的困难（Difficulties）：

由于需要对每个实体对进行分类，为了加快运行的速度，提出了有效的batch 计算方法。主要是对标记使用和实体相同的位置嵌入和注意力层中的文本token不与标记token进行注意力的计算，这两个措施可以使我们重用文本token的计算，因为文本token的表示和标记token的表示分离开来了。在实践中，我们将所有实体对对标记插入到句子末尾组成输入，这加快了速度且仅仅导致了很少的性能损失。

实验结果（Results）：

语料：

实验结果（使用cross-sentece机制模型性能得到了显著的提升）：

加速实验结果（处理速度得到了显著的提升）：

做出的贡献（Contributions）：

1. 使用了pipeline的方法，训练了两个独立的编码器，性能很好；

2. 我们对实验因素影响实验性能进行了分析，并且得出结果学习不同的(实体和关系)上下文表示比联合学习更好；

3.提出了加速的方法，大大加快了模型处理数据的速度，性能略微有所下降。

未来展望（Future Work）：

Jointly真的比Pipeline好吗？

hithithithithit

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
PURE(A Frustratingly Easy Approach for Entity and Relation Extraction)

写作动机（Movitation）：任务定义（Task Definition）：相关工作（Related Work）：提出的方法（Methods）：使用的技术（Techniques）：遇到的困难（Difficulties）：实验结果（Results）：做出的贡献（Contributions）：未来展望（Future Work）：...
复制链接

扫一扫

专栏目录

hithithithithit CSDN认证博客专家 CSDN认证企业博客

码龄7年

95: 原创

7万+: 周排名

18万+: 总排名

8万+: 访问

: 等级

1218: 积分

576: 粉丝

78: 获赞

28: 评论

270: 收藏

私信

关注

热门文章

分类专栏

ASR 1篇
C++日记 7篇
RealDeepLearning
设计模式 3篇
深度学习 3篇
pytorch编程基础 13篇
python 9篇
Python 语法 2篇
开发 2篇
Flask Web开发 3篇
docker 7篇
git 1篇
node.js 2篇
Django开发 8篇
mysql 4篇
开发工具 2篇
论文 9篇
RE 11篇
Prompt 5篇
NER 1篇
nlp knowledge 7篇
算法 1篇
centos 9篇
数据结构与算法 2篇

最新评论

Error日志 ERROR: Failed building wheel for jsonnet
m0_62838877: 请问博主 jsonnet这个模块不能再说Windows下安装吗？安装它一直出错
Error日志 ERROR: Failed building wheel for jsonnet
weixin_44735777: 很强，解决了
Text-to-Table: A New Way of Information Extraction
Ultraman Tiga: 博主，我还想问下你，Embeddings应该怎么去理解啊，可以理解为词向量吗？
Text-to-Table: A New Way of Information Extraction
Ultraman Tiga: 好滴好滴，明白了，谢谢博主
Text-to-Table: A New Way of Information Extraction
hithithithithit: 这里说的有点问题，文中的任务是一个通用的信息抽取，包含多个任务，所以这里不需要对任务进行区别，即对输出进行调整进行训练就可以得到想要的结果，所以不需要定义schema，仅输入你要的文本就可以了，也即数据驱动的方法

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

hithithithithit 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。