事件、事件抽取与事理图谱

人类社会是一个静态事物进行动态活动所创造形成的世界,人类的命题记忆是以“事件”为存储单位的,存储的是组成事件的概念及其之间的关系以及事件及其之间的关系,以事件作为知识的基本单元更能反映客观世界的知识,特别是知识的动态性,从认知心理学的角度来看,事件更符合人类的理解与思维习惯。知识库是机器实现认知智能的根本前提之一,如何让机器能够以一种更为接近于人脑知识结构体系的方式武装自己,是信息抽取以及知识工程领域一直致力攻克的方向。目前,以“事件”为核心开展信息抽取、语言资源建设、事理图谱建设等相关工作是新的制高点,本文主要以“事件”为核心,对事件、事件抽取、事件关系抽取、事理图谱相关的知识概念进行了简要的介绍。

事件

事件是什么,有多种定义,从不同的学科角度可以得到不同的答案。哲学上,公元前伟大的哲学家亚理斯多德认为,事件是可以感知的、相对独立的、运动的存在,是一种非静态的概念,一个典型的事件是一个行为的序列或者一系列状态的改变,是随着时间变化的具体事实;在认知学科上,斯坦福大学著名教授zacks[2001]提出,事件是被旁观者所观察到的在现实世界所产生的行为,可以通过时空结构来理解。有趣的是,这位教授还将事件与动作进行了区分,即动作是行为者刻意的行为,动作一定是事件而事件不都能称为动作,动作是客观的,而事件是被观察者观察得到的。语言学方面,Chung[1985]年提出事件结构,认为“事件是谓词、谓词发生的时间段、谓词发生的情况或者条件三个部分组成的术语”;Putejovsky[2000]提出以基础谓词为中心的事件理论;在信息领域,最早由美国国防高级研究计划委员会DARPA举办的Topic Detection and Track(话题检测与追踪)会议,将事件定义成“特定时间、特定地点发生的事情”,一个话题由多个事件组成;在本体研究领域,事件则是在指在某个特定时间和环境下发生的由若干角色参与并表现出若干动作特征的一类事情。

通过以上的介绍我们可以看到,不同领域对事件的定义存在差异,并且体现了该领域所关注的实际问题。哲学和认知学科中更加关注事件的本源和概念,语言学领域更注重从词法和句法层面探究事件的语法结构和语义;信息领域则更关注事件在信息处理中的应用,包括事件的识别、获取以及事件应用;本体领域则更关注更细粒度的事件表示,力求从表示、事件关系、事件与概念本体之间的关系做体系的分析。而在这些存在差异的理解当中,也存在着一个共同之处,即都认为事件是人类知识中重要的组成部分,世界是由动态事件组成的,而且都在时间的刻画和表示形式上不断钻研。

事件抽取

事件抽取(event extraction)是信息抽取领域中重要的一个组成部分。目前关于事件抽取这一任务相关的技术评测主要包括MUC、ACE、TDT、TAC-KBP、BioNLP等,其中由美国DARPA于1987-1997年举办的MUC(Message Understanding Conferences)消息理解会议,任务包括命名实体识别、模板关系抽取等,其中的场景模板(Scenario Template)填充任务涉及事件抽取;作为MUC的后继者,由美国国家标准与技术研究所NIST先后在1999年至2008年举办的ACE(Automatic Content Extraction)系列评测,其中的事件探测与识别VDR任务涉及事件抽取;2009年ACE由TAC(Text Analysis Conference )正式接棒,ACE成为TAC的一个子任务;由DARPA资助举办的TDT(Topic Detection and Track)话题检测与追踪会议于1998年到2004年举办,起源于早期的事件检测与追踪项目EDT(Event Detection and Tracking)是以事件作为核心的评测会议之一,主要关注话题的产生与变化;BioNLP是一个生物文本挖掘评测项目,其中包括生物事件的抽取任务。

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值