IEEE2019_A Survey of Event Extraction from Text

论文

摘要

每天在各地有无数重大事件发生,不同的媒体以不同的叙事风格进行报道[1]。如何检测文章和帖子中是否报告了真实世界的事件是事件抽取的主要任务之一。其他任务包括抽取事件论元并确定它们的角色,以及从不同文本中对相似事件进行聚类和跟踪。事件抽取作为自然语言处理和理解领域的重要研究课题之一,在不同领域有着广泛的应用,并已进行了几十年的深入研究。
本文对文本事件抽取做了一个全面而又最新的综述

  • 总结了用于事件抽取的任务定义、数据源和性能评估;
  • 为其解决方案方法提供了分类。在每个解决方案组,提供了最具代表性的方法的详细分析,特别是它们的起源、基础、优缺点;
  • 对未来的研究方向提出了展望。

Ⅰ. 介绍

事件是在特定时间、特定地点发生的涉及一个或多个参与者的特定事件,通常可以被描述为状态的改变。事件抽取的目标是检测文本中的事件实例,如果存在,则识别事件类型及其所有参与者和属性。可以用不同的自变量定义不同的事件类型,事件提取的简单总结是从非结构化自然语言获得事件的结构化表示,以回答“5W1H”问题,“who, when, where, what, why” and “how”。

事件抽取作为自然语言处理(NLP)中信息检索的一项重要任务,在各个领域有着广泛的应用。

  • 结构化事件可以直接用于扩展知识库,在此基础上可以进行进一步的逻辑推理和推理[2]、[3]。
  • 事件检测与监控长期以来一直是政府公共事务管理的重点,及时了解社会热点事件的爆发与演变,有助于政府部门及时响应[4]、[5]、[6]、[7]、[8]。
  • 在商业和金融领域,事件抽取还可以帮助企业快速发现其产品的市场反应,推断风险分析信号和交易建议[9],[10],[11]。
  • 在生物医学领域,事件抽取可以用来识别生物分子(如基因和蛋白质)的状态变化或两个或多个生物分子之间的相互作用,这在科学文献中用自然语言描述,以了解生理和发病机制[12]。

简而言之,许多领域都可以从事件抽取技术和系统的进步中受益。
尽管有很好的应用前景,但事件提取仍然是一项相当具有挑战性的任务,因为事件具有不同的结构和组件;而自然语言往往存在语义歧义和语篇风格。此外,事件抽取也与其他NLP任务密切相关,如命名实体识别(NER)、词性标注(POS)、语法解析等,这些任务的执行方式和输出结果可能会促进事件抽取,也可能会对其性能产生负面影响。为了促进事件抽取的发展和应用,人们开展了许多公开评估计划,提供任务定义、标注语料库和公开竞赛,以促进事件抽取等信息抽取研究,这些研究也吸引了许多人才贡献新的算法、技术和系统。下面我们简单介绍一下这些知名的节目。

A. 公开评估项目

在这里插入图片描述

  • 信息理解会议(MUC)[13]、[14]被公认为第一个信息提取的公开评估项目,它是由国防高级研究计划局(DARPA)组织和赞助的。从1987年到1997年,它已经举办了七次。MUC的目标是从非结构化文本中提取信息,并将其填充到预定义模式中的槽值结构中。一些公共槽包括实体、属性、实体关系、事件等。
  • 1997年,美国国防部高级研究计划局(DARPA)、卡内基梅隆大学(Carnegie Mellon University)、龙系统(Dragon Systems)和马萨诸塞大学阿默斯特分校(University Of Massachusetts At Amherst)共同创立了另一个公共评估项目,名为主题检测和跟踪(TDT),以促进在一系列广播新闻文章中发现和跟踪新事件。后来,美国国家标准与技术研究所(NIST)为TDT项目建立了一套完整的评估体系。
  • 自动内容抽取(ACE)是迄今为止最具影响力的公共评价方案,由NIST于1999年提出,并于2009年被纳入新的公共评价方案文本分析会议(TAC)。从2000年到2004年,ACE一直致力于实体和关系的检测和跟踪,并从2005年开始将事件提取任务添加到ACE中。
  • 继ACE之后,DARPA的深度探索和文本过滤(DEFT)计划提出了文本标注和信息提取的实体、关系、事件(ERE)标准。Light ERE被定义为ACE注释的简化版本,以便快速生成一致标签的数据。随后,Light ERE被扩展到更复杂的Rich ERE规范。
  • 此外,事件抽取一直是知识库人群(KBP)公众评估项目的主流任务,该项目自2014年以来已举办了四届,截至目前。现在,KBP已经与TAC集成,目的是从大型文本语料库中提取信息,以补充知识库中不足的元素。此外,还有其他一些用于特定领域的事件提取的事件公共评估程序,如生物医学领域的BioNLP、用于提取事件时间信息的TimeBank

B.调查总结

本文提供了从文本中提取事件的最新研究。我们注意到关于这个任务有一些相关的调查文章,但是每一篇文章都针对特定的应用领域有特定的重点。

  • Hogenboom等人:回顾了各种决策支持系统中事件提取的文本挖掘技术;
  • Vanegas等人:主要对生物分子事件提取技术进行了综述;
  • Zhang等人:主要研究开放领域事件抽取;
  • 一些人还专注于从社交媒体,尤其是Twitter中提取事件。

Ⅱ. 事件抽取任务

事件抽取旨在检测文本报告中的事件是否存在,如果存在,则从文本中抽取与事件相关的信息,例如“5W1H”(who、when、where、what、why、how)。

有时,特定的事件结构是预定义的,它不仅包括事件类型,还包括事件论元的角色。事件提取不仅需要检测事件,还需要提取相应的字/词/短语来填充给定的事件结构,从而输出结构化的事件形式,这通常称为闭域事件抽取(closed-domain event extraction)。而开放域事件抽取(open-domain event extraction)不假定事件结构是预定义的,主要任务是检测文本中事件的存在。在许多情况下,它还提取关于事件的关键字,并对相似事件进行聚类。

A. 闭域事件抽取

闭域事件提取使用预定义的事件模式从文本中发现和提取特定类型的期望事件。事件架构包含几种事件类型及其对应的事件结构。我们使用ACE术语介绍如下事件结构:

  • Event mention:事件提及,描述事件的短语或句子,包括一个触发器和几个论元。
  • Event trigger:事件触发器,最清楚地表达事件发生的词,通常是动词或者名词。
  • Event argument:事件论元,在事件中充当参与者或者具有特定角色属性的实体名称、时间表达或值。
  • Argument role:论元角色,论元与其参与的事件之间的关系。

需要注意的是,同一事件可能在不同的句子或文档中被多次提及。如何区分同一事件的多个事件提及属于另一个关键的自然语言处理任务,称为事件共指。在本文中,我们不考虑事件提及共同参考解决方案。
Ahn 首先提出将ACE事件提取任务分为四个子任务:触发器检测、事件/触发器类型识别、事件论元检测、论元角色识别。例如,考虑以下句子:

sentence 1:At daybreak on the 9th, the terrorists set off a truck bomb attack in Nazareth.
句子1:9日黎明时分,恐怖分子在拿撒勒发动了一场卡车炸弹袭击。

在此句中存在“Conflict/Attract”事件。事件提取器应该通过检测句子中的触发词“Attract”并将其分类为“Conflict/Attract”事件,接下来,应该从文本中提取与该事件相关的论元,并根据预定义的事件结构标识它们各自的角色。
在这里插入图片描述

上图给出了结构化事件的闭域提取。左边部分说明了ACE 2005中一些预定义的事件模式;而右边部分则说明了触发器检测、事件类型识别、论元检测和论元角色识别四个子任务的提取结果。

遵循ACE 的类似定义,许多其他事件类型和结构已在该领域中定义和采用:

  • 如ERE和TAC-KBP定义的那些;
  • Petroni(彼得罗尼)等人定义了自然灾害事件的结构,包括7种事件类型,如“洪水”、“风暴”、“火灾”等。以及它们的“5W1H”属性,以便从新闻报道和社交媒体中提取突发事件;
  • Yang等专注于提取金融领域的事件,以帮助预测股市、投资决策支持等。他们定义了9种金融事件类型,如“股权质押”、“股权冻结”等,以及它们对应的具有不同角色的论元;
  • Han等人定义了一个包含8个事件类型和16个子类型的业务事件分类,它们有相应的论元,如时态、时间、结果、实体等。

B. 开放域事件抽取

开放域事件提取旨在没有预定义的事件模式情况下从文本中检测事件,在大多数情况下,还通过提取的事件关键字对相似事件进行聚类。事件关键词是指那些主要描述一个事件的单词/短语,有时关键词进一步分为触发器和论元。

TDT公共评估计划旨在从新闻文章自动发现以前未报告的事件,或跟踪以前发现的事件的进展。除了事件之外,TDT还将故事定义为描述特定事件的新闻文章片段,主题是文章中与某个现实世界主题密切相关的一组事件。

根据上述故事相关定义,TDT定义了以下任务:

  • Story segmentation:故事分割,从新闻文章中检测故事边界;
  • First story detection:第一故事检测,检测新闻流中讨论新话题的故事;
  • Topic detection:话题检测,根据故事讨论的主题对故事进行分组;
  • Topic tracking:话题跟踪,检测讨论以前已知话题的报道
  • Story link detection:故事链接检测,判断一对故事是否讨论同一主题。

前两个任务主要用于事件检测,后三个任务用于事件聚类。虽然这五项任务之间的关系很明显,但每项任务都需要不同的评估过程,并鼓励采取不同的方法来解决特定的问题。

前两个任务主要用于事件检测,后三个任务用于事件聚类。虽然这五项任务之间的关系很明显,但每项任务都需要不同的评估过程,并鼓励采取不同的方法来解决特定的问题。

除了TDT任务外,还开展了许多其他研究,用于从新闻文章中检测和聚类开放领域事件。例如:

  • 欧盟委员会联合研究中心调查了从在线新闻中提取暴力事件,如被杀、受伤、被绑架等关键字,用于全球危机监测;
  • Yu和Wu将关于同一事件的新闻文章聚集到一个以主题为中心的集合中;
  • Liu等人按政治、经济、社会、体育、娱乐等日常重大事件分类新闻报道。

一些工作集中在句子级别的事件检测和聚类,例如;

  • Naughton等人,新闻文章中涉及同一事件的分组句子,其中非事件句子在启动聚类过程之前被移除,他们使用了一组从不同来源收集的新闻故事来描述与伊拉克战争有关的事件。此外,在对事件相关句子进行分组时,他们还设计了聚类标签,如恐怖袭击、爆炸、枪击、空袭等。
  • Wang等人,除了事件检测和聚类还建议提取每个事件的关键字,如事件的类型、地点、时间和人物。

除了新闻专线的文章,许多在线社交媒体,如Twitter和Facebook等,都提供了丰富和及时的各种类型的事件信息。最近,从社交媒体中检测和提取事件也成为一项重要的任务。值得注意的是,由于社交网络上的帖子是一种存在大量缩写、拼写错误和语法错误的非官方文本,如何从这类在线帖子中提取事件面临着比从新闻文章中提取事件更多的挑战。

虽然检测和聚类事件是开放领域事件抽取的主要任务,但一些研究人员也提出了通过为每个事件簇分配一个事件类型标签以及一个或多个事件属性标签来进一步从聚类的事件相关语句和文档中构建事件模式。注意,这样的簇标签可以更好地解释为从每个簇的关键字进行的一种语义合成,而不是像在闭域事件提取中那样具有清晰结构的预定义的簇标签。

Ⅲ. 事件抽取语料库

本部分主要介绍事件抽取任务的语料库资源。通常,公开评测程序为事件抽取的任务评测提供了多个语料库。公共评测程序根据任务定义对语料库进行人工标注,并用于机器学习方法中的模型训练和验证;样本标注由具有领域知识的专业人员或专家完成,标注后的样本可视为带有ground truth标签。然而,由于标注过程成本高昂,许多公共语料库规模较小,覆盖率较低。

A. ACE事件语料库

ACE评测为各种提取任务提供带标注的数据和评估工具,包括实体、时间、值、关系和事件。ACE中的实体分为7种类型(人员、组织、地点、地缘政治实体、设施、车辆和武器),每种类型都有若干子类型。此外,时间是根据TIMEX2标准标注的,TIMEX2标准是自然语言文本中事件和时间表达式的丰富规范语言。每个文本样本都由两个独立的标注者进行双重标注,由资深标注者判断它们之间的版本差异。

ACE语料库中的事件具有复杂的结构和论元,涉及到实体、时间和值。ACE 2005事件语料库定义了8种事件类型和33个子类型,每个事件子类型对应一组论元角色。所有事件子类型总共有36个论元角色。在大多数基于ACE语料库的研究中,往往将33个事件子类型单独处理,而不进一步检索它们的层次结构。

下表提供了ACE事件类型及其对应的子类型:
在这里插入图片描述
下图给出了一个标注事件样本的示例。
在这里插入图片描述
ACE 2005语料库共包含599个标注文档和约6000个标注事件,包括英语、阿拉伯语和汉语等不同媒体来源的事件,如新闻热线文章、广播新闻等。下表提供了它们的源统计信息:
在这里插入图片描述

B. TAC-KBP 语料库

TAC-KBP中的事件块检测任务专注于检测对事件的明确提及及其在RichERE中定义的类型和子类型。由语言数据联盟(LDC)提供的TAC-KPB 2015语料库包括158个文档作为先前训练集,以及202个附加文档作为正式评估的测试集,这些文档来自新闻报道文章和论坛。

参照ACE语料库,定义了TAC-KBP(Rich Ere)中的事件类型和子类型,包括9种事件类型和38个子类型。此外,事件提及必须被分配到三个真实值中的一个:实际(实际发生)、一般(没有具体的时间或地点)和其他(非一般事件,如失

  • 3
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

All in .

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值