原文:Joint Event Extraction via Recurrent Neural Networks (https://www.aclweb.org/anthology/N16-1034/)
读此文之前,应有一些事件抽取的概念基础。
摘要:事件抽取是信息抽取领域一个具有挑战性的任务。本文提出了一个基于循环神经网络的事件抽取联合模型,既避免了管道模型中的误差传播问题,同时也考虑到了事件触发词和事件元素之间的关系。
引言:
事件抽取:标识文本中的触发器以及其指定类型和触发器对应的事件元素。触发器通常是引起一个事件的动词或动名词,而事件元素是参与这个事件的相关实体。
对于相同的事件可能有不同的表达,对于同一个表达可能在不同的语义环境中表达不同的事件。
比如:
attack a stronghold / fight a stronghold 这两个同为攻击事件
I like the apple. 在不同的语义环境中,苹果的语义也不同,可以是水果也可以是手机
对于事件抽取的方法主要有两种:
(1)管道模型:首先识别事件触发器,之后再进行事件元素的识别。
(2)联合模型:同时预测句子的事件触发器和事件元素。
联合模型缓解了管道模型存在的误差传播问题,并考虑了事件触发器和事件元素之间的依赖关系。
事件抽取任务描述
ACE(Automatic Content Extraction)定义事件为:发生的事务或导致某个状态改变的事务。
Event mention: 事件发生的短语或句子,包含一个触发词和任意数量的事件元素
Event trigger: 能清楚表示事件发生的词
Event argument: 事件的参与者或者在事件中具有一个角色属性的实体信息。
(比如:人物、时间、地点、目标)
ACE事件类型包含8个大类和33个子类,每个子类都有固定的角色集需要事件元素来填充。
比如:死亡事件