论文笔记 EMNLP 2020|Connecting the Dots: Event Graph Schema Induction with Path Language Modeling

125 篇文章 12 订阅

1 简介

论文题目:Connecting the Dots: Event Graph Schema Induction with Path Language Modeling
论文来源:EMNLP 2020
论文链接:https://aclanthology.org/2020.emnlp-main.50.pdf
代码链接:http://blender.cs.illinois.edu/software/pathlm

1.1 创新

  • 提出一个新的事件模式表示的语义模式归纳框架,编码事件结构和事件-事件关系,同时提出两个新的评估指标来评估图模式的覆盖率和连贯性。
  • 提出一个路径语言模型,用于选择显著且连贯的事件-事件路径并构建概率和语义连贯的事件图模式。

2 问题表述

给一个文档,抽取其中的实体、关系、事件实例,构造事件实例图(节点表示实体或者事件,边表示事件-论元角色或者实体-实体关系)。事件图模式归纳(Event Graph Schema Induction)的目标是从事件实例图中生成循环的图模式,对于每个事件类型对生成一个事件图模式(节点和边分别为事件实例图对应的类型),如下图。
在这里插入图片描述

3 方法

主要包括下面几个部分:

3.1 实例图的构建

使用信息抽取系统或者人工标注,抽取实体、实体-实体关系、事件和论元,实例路径和事件-事件路径(节点和边的类型)的公式如下:

3.2 自回归路径语言模型

自回归路径语言模型使用transformer对路径序列进行打分(如下图),为了区分节点和边,设置Element编码[1,2,1,…,1,2],Loss函数如下:
在这里插入图片描述
在这里插入图片描述

3.4 邻居路径分类

为了捕捉路径之间的一致性,使用一个二分类器学习两条路径的发生概率,相同事件实例v和v’的共现路径为邻居路径;相同事件类型的路径为负邻居路径,使用CLS标签进行分类,公式如下:

3.5 图模式构建

给两个事件类型,通过合并topk个路径得到图模式,打分函数包括语言模型和邻居分类两部分,公式如下(第二行第二个公式为节点和边的打分函数):

4 实验

实验数据集为ACE2005,数据统计如下( H i s t o r i c a l a n n Historical_ann Historicalann表示人工标注的事件实例图, H i s t o r i c a l s y s Historical_sys Historicalsys表示系统抽取的事件实例图):
在这里插入图片描述

提出两个评测指标,Instance Coverage和Instance Coherence:

  • Instance Coverage:使用每个图模式s和ground-truth实例图g进行匹配,使用交集计算准确率和召回率,公式如下:
  • Instance Coherence:使用该指标评价图是连贯的(与同一文档尽可能匹配,与其他文档尽可能不匹配),公式如下:
    在这里插入图片描述

将归纳的模式加入到信息抽取系统(ONEIE)中,过程如下,公式如下( s ′ ( G ) s'(G) s(G)为每个实体、关系、事件的类型预测分数):在这里插入图片描述
在这里插入图片描述

实验结果如下:
在这里插入图片描述
在这里插入图片描述
加入归纳的事件模式后,信息抽取的实验结果如下:
在这里插入图片描述

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

hlee-top

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值