GPLinker:基于GlobalPointer的事件联合抽取

73ef91fd48800e9aac633f08d0208816.gif

©PaperWeekly 原创 · 作者 | 苏剑林

单位 | 追一科技

研究方向 | NLP、神经网络

大约两年前,笔者在百度的“2020语言与智能技术竞赛”中首次接触到了事件抽取任务,并在文章《bert4keras 在手,baseline 我有:百度 LIC2020》[1] 中分享了一个转化为 BERT+CRF 做 NER 的简单 baseline。不过,当时的 baseline 更像是一个用来凑数的半成品,算不上一个完整的事件抽取模型。而这两年来,关系抽取的模型层见迭出,SOTA 一个接一个,但事件抽取似乎没有多亮眼的设计。

最近笔者重新尝试了事件抽取任务,在之前的关系抽取模型 GPLinker 的基础上,结合完全子图搜索,设计一个比较简单但相对完备的事件联合抽取模型,依然称之为 GPLinker,在此请大家点评一番。

be80793f562e7701c3871cb3cfff0c0b.png


任务简介 

事件抽取是一个比较综合的任务。一个标准的事件抽取样本如下:

5725abbaedadfc0972b694df86e9aad0.png

▲ 标准的事件抽取样本(图片来自百度DuEE的GitHub)

每个事件会有一个事件类型以及相应的触发词,并且配有不同角色的论元。事件类型和论元角色是在约定的有限集合(schema)中选择,而触发词和论元一般情况下都是输入句子的片段,少数情况下也是可枚举的分类对象(百度的 DuEE-fin 出现过)。

原则上来说,事件抽取模型的设计取决于评价指标,在 LIC2020 中,我们之所以可以将事件抽取转化为一个 NER 问题,是因为当时的评测指标只考察(事件类型,论元角色,论元)构成的三元组,因此我们可以将(事件类型, 论元角色)组合成一个大类,然后就跟 NER 对应上了。

当然,这只是针对该指标的一种取巧方式。对于真实的事件抽取场景,我们自然是希望把标准格式的事件抽取出来,也就是设计一个尽量完备的模型。下面将介绍我们用于事件抽取的 GPLinker 模型,它基本达到了简单而完备的要求。


1d9631a592a2b695d8e9cca630d7f90e.png

  • 2
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要基于FNDEE数据集实现领域多事件信息联合抽取,可以遵循以下步骤: 1. 数据预处理:将FNDEE数据集中的各个事件的信息进行整合和融合,构建出多事件联合抽取的数据集。需要注意的是,要保证不同事件之间的实体和关系信息不会相互冲突或重复。 2. 实体识别:使用命名实体识别(NER)技术,对文本中的实体进行识别和标注。可以使用预训练的深度学习模型,如BERT、RoBERTa等,也可以使用传统的统计学习方法,如条件随机场(CRF)等。 3. 关系抽取:使用关系抽取技术,对文本中的实体之间的关系进行抽取和标注。可以使用基于规则的方法,如正则表达式、语法分析等,也可以使用深度学习模型,如卷积神经网络(CNN)、循环神经网络(RNN)等。 4. 事件抽取:使用事件抽取技术,对文本中的事件进行抽取和标注。可以使用基于规则的方法,如模板匹配、规则匹配等,也可以使用深度学习模型,如LSTM、GRU等。 5. 多事件联合抽取:将不同事件之间的实体、关系和事件信息进行联合抽取。可以使用基于图神经网络的方法,如GCN、GAT等。也可以使用迁移学习等技术,将已有的相关数据用于模型的训练和优化。 以上是基于FNDEE数据集实现领域多事件信息联合抽取的基本步骤。具体实现方式还需要根据具体情况进行调整和优化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值