EMNLP-21-Document-level Entity-based Extraction as Template Generation——NER template范式

YingJingh

已于 2022-09-10 11:12:40 修改

阅读量291

点赞数

分类专栏： EMNLP 论文记录

于 2022-09-09 22:00:20 首次发布

本文链接：https://blog.csdn.net/Hekena/article/details/126789543

版权

BART模型信息抽取复制机制注意力头文档级实体提取

关键词由CSDN通过智能技术生成

论文记录同时被 2 个专栏收录

147 篇文章 9 订阅

订阅专栏

EMNLP

18 篇文章 2 订阅

订阅专栏

1领域：

文章级别基于entity的信息抽取（第一次见这种任务描述），文中给出的任务说明是：文档级基于实体的提取 (EE) 是从跨多个句子的非结构化文本中提取以实体为中心的信息（例如实体及其关系）的任务。——entity role and entity relation。

2总结

整理完之后，感觉模板只是很粗浅的一部分，是这个论文的一部分，他的关键是如何把控BART的generation，文中考虑BART原有的generation概率，也考虑了copy机制，在copy机制中，改进了attention head的选择方式，不再是考虑全部的attention head，而是选择top-k的head作为copy 的计算来源。

模板是形，BART改进是实。它们保证了整个模型的效果。

3文章工作：

Document-level entity-based extraction (EE),建模为两个文档级 EE 任务的生成框架：角色填充实体提取 (REE) 和关系提取 (RE)。
两个任务的模板如下：
在这里插入图片描述
创新点：应该是copy mechanism，注意力机制。Cross-attention guided copy mechanism
(1) naive copy: 在时间t时刻的Pcopy 在所有input tokens上的分布的一种简单方法：是取最后一个解码器层在所有头上的交叉注意力的平均值。在这里插入图片描述
（2）文中提出的top-k复制机制，只有前k重要的attention heads用于计算copy distribution。
每个注意力头被表示为:

之后，使用转移矩阵，计算头的重要性程度：

选择top-k的注意力头作为copy 计算的依据：

4train目标

BART预测的word是结合了generation概率和copy概率：pgen ∈ [0, 1] is the generation probability
在这里插入图片描述

计算pre word和target word之间的损失函数。
在这里插入图片描述

5消融实验

（1）Top-k中，K的取值。
（2）不同的模板。

YingJingh

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
EMNLP-21-Document-level Entity-based Extraction as Template Generation——NER template范式

整理完之后，感觉模板只是很粗浅的一部分，是这个论文的一部分，他的关键是如何把控BART的generation，文中考虑BART原有的generation概率，也考虑了copy机制，在copy机制中，改进了attention head的选择方式，不再是考虑全部的attention head，而是选择top-k的head作为copy 的计算来源。模板是形，BART改进是实。它们保证了整个模型的效果。
复制链接

扫一扫