文章目录
事件抽取的定义
- 事件
作为信息的一种表现形式,其定义为特定的人、物在特定时间和特定地点相互作用的客观事实,一般来说是句子级的。
-
组成元素
组成事件的各元素包括: 触发词、事件类型、论元及论元角色。
事件触发词(event trigger):表示事件发生的核心词,多为动词或名词;
事件类型:ACE2005 定义了8种事件类型和33种子类型。其中,大多数事件抽取均采用33 种事件类型。事件识别是基于词的34 类(33类事件类型+None) 多元分类任务,角色分类是基于词对的36 类(35类角色类型+None) 多元分类任务;
事件论元(event argument):事件的参与者,主要由实体、值、时间组成。值是一种非实体的事件参与者,例如工作岗位 ;
论元角色:事件论元在事件中充当的角色。共有35类角色,例如,攻击者 、受害者等。
理解定义
事件抽取并不是从非结构化文本中抽取未知事件,而是在已经定义好了34类事件后
从文本中寻找事件触发词(event trigger),以匹配事件
并将事先定义好的事件模板中的每个角色(论元角色),找到它对应的实体。
比如 小明 攻击了 小红
通过早就定义好的模板
攻击事件
包括