Entity, Relation, and Event Extraction with Contextualized Span Representations

在这里插入图片描述

Abstract

本文提出了一个框架DYGIE++,通过枚举、提炼和评分文本span来完成信息抽取任务,这些文本span旨在捕获局部和全局上下文。通过BERT的语境化嵌入在捕获相同或相邻句子中实体之间的关系方面表现良好,而动态span图更新建模长span的交叉句子关系。通过预测的共指链接传播span表示可以使模型能够消除具有挑战性的实体提及的歧义。

1.Instruction

共指关系的知识可以提供信息来帮助推断所提及的难以分类的实体的类型。本文的模型框架如figure 1 所示。
在这里插入图片描述

2. Model

2.1 Task definitions

输入:从序列中构造span S = { s 1 , . . . , x T } S=\{s_1,...,x_T\} S={s1,...,xT}
NER涉及为每个span s i s_i si预测最佳实体标签类型 e i e_i ei
RE任务设计所有span对 ( s i , s j ) (s_i,s_j) (si,sj)预测最佳关系类型 r i j r_{ij} rij本文研究的数据集,所有的关系都是同一句话中span之间的关系。
共指解析任务是预测每个span s i s_i si的最佳共指先行语 c i c_i ci.

2.2 DyGIE++ Architecture

Token encoding 使用BERT作为编码器,并使用“滑动窗口”方法,将每个句子连通周围句子的大小为L的邻域一起提供给BERT。
Span Enumeration 文本span是通过串联表示其左和右的token以及学习span宽度嵌入来枚举的。
Span Graph Propagation 基于模型对文档中存在的span之间的关系的当前最佳猜测,动态地生成图结构。根据图传播的三种变型,通过在图中集成来自其邻居的span表示来更新每个span表示 g j t g^t_j gjt。在共指传播中,一个span在图中的邻居可能是它的共指先行语。在关系传播中,邻居是句子中的相关实体。
在每个迭代t处,该模型的span表示 s t ∈ R d s^t\in R^d stRd:
在这里插入图片描述
V x t ( i , j ) V_x^t(i,j) Vxt(i,j)表示任务x下span i 和 j 的最相似度量。

3. Experiments

3.1 Result

在这里插入图片描述

3.2 Benefits of Graph Propagation

在这里插入图片描述
关系传播提高了BERT的关系抽取性能,但不能改善微调的BERT。作者认为,这是因为所有的关系都在一句话中,因此可以训练BERT来很好地建模这些关系。

4. 启示

  1. A general framework for information extraction using dynamic span graphs的升级操作,创新点在于运用了BERT和滑动窗口的方法获得cross-sentence表示,比起基础版的模型又多了一项事件抽取任务。
  2. 有必要将这两篇论文进行复现,是很好的baseline模型。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

自然语言处理CS

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值