2021-07-06

最新推荐文章于 2022-09-29 18:06:23 发布

Masterki

最新推荐文章于 2022-09-29 18:06:23 发布

阅读量234

点赞数

分类专栏：关系抽取(RE) 文章标签：自然语言处理 pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Masterki/article/details/118514761

版权

关系抽取(RE) 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

论文笔记

A Frustratingly Easy Approach for Joint Entity and Relation Extraction

概述

本文是陈丹琦博士关于实体识别与关系抽取的一篇论文，文本使用了一种pipeline的方式而非joint learning的方式超越了之前的一众模型，在数据集ACE04/05、SciERC达到SOTA。

NER采用span-based的模型，其实也是解决嵌套实体的问题。
在RE的输入端加上了实体类型。（最大的亮点）

（pipeline 指的是使用两个不同的模型去做NER(实体识别)，RE（关系抽取，joint 是指使用一个模型完成两个任务，近年来的研究结果joint 的模型往往效果更好，但是这篇论文采用的是pipeline的形式实现结果超过了以往的所有joint的模型，算是打破了近年来joint一定比pipeline好的观点。）

模型

上文我们就提过了，在关系模型的输入端添加了实体类型信息，<s:md>表示实体开始，</s:md>表示实体结束，其中s代表subject，md是实体名。在c部分中颜色一样代表一样的position embeding.

新的改变

Cross-sentence context:其实是引入上下句信息
encoder:采用了bert,ALbert
Efficient Batch Computations：采用了近似计算节省开销

位置信息共享,可以理解成，<s:md>与实体的第一个字表示一致，</s:md>与实体的走后一个字表示一致。
attention约束：在一个span里所有text只与text做attention，而实体字符（就是人为加入的<s:md>）即于实体字符做attention,也与text做attention.
这样在同一个句子里的所有的所有span都能复用text的attention

实验结果

在这里插入图片描述
在数据集ACE04/05、SciERC达到SOTA。

上下文信息对比，近似计算（Approx）
在这里插入图片描述
加入上下文信息明显更好，Approx提高了10倍以上的速度

Maker对比
在这里插入图片描述
Text：原来的纯文本信息
TYPEDMarkers :本文采取的方式
增加实体类型确实对实验效果有较大帮助。
共享encoder

共享了encoder反而效果变差，怎么理解呢，ner和re需要的输入格式就有差别，完成的任务也不同，共享encoder反而增加了噪声（希望大家一起探讨）。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2021-07-06

论文笔记A Frustratingly Easy Approach for Joint Entity and Relation Extraction原文链接github概述本文是陈丹琦博士关于实体识别与关系抽取的一篇论文，文本使用了一种pipeline的方式而非joint learning的方式超越了之前的一众模型，在数据集ACE04/05、SciERC达到SOTA。NER采用span-based的模型，其实也是解决嵌套实体的问题。在RE的输入端加上了实体类型。（最大的亮点）（pipel
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。