事件抽取详细入门概述(Event Extraction) & ACE2005数据集

事件抽取的定义

  • 事件

作为信息的一种表现形式,其定义为特定的人、物在特定时间和特定地点相互作用的客观事实,一般来说是句子级的。

  • 组成元素

    组成事件的各元素包括: 触发词、事件类型、论元及论元角色。

    事件触发词(event trigger):表示事件发生的核心词,多为动词或名词;
    事件类型:ACE2005 定义了8种事件类型和33种子类型。其中,大多数事件抽取均采用33 种事件类型。事件识别是基于词的34 类(33类事件类型+None) 多元分类任务,角色分类是基于词对的36 类(35类角色类型+None) 多元分类任务;
    事件论元(event argument):事件的参与者,主要由实体、值、时间组成。值是一种非实体的事件参与者,例如工作岗位 ;
    论元角色:事件论元在事件中充当的角色。共有35类角色,例如,攻击者 、受害者等。

理解定义

事件抽取并不是从非结构化文本中抽取未知事件,而是在已经定义好了34类事件后
从文本中寻找事件触发词(event trigger),以匹配事件
并将事先定义好的事件模板中的每个角色(论元角色),找到它对应的实体。

比如 小明 攻击了 小红
通过早就定义好的模板

攻击事件
包括

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值