事件图谱的构建、推理与应用

点击上方蓝字关注我们


事件图谱的构建、推理与应用

胡志磊1,2,3, 靳小龙1,2,3, 陈剑赟4, 黄冠利5

1 中国科学院网络数据科学与技术重点实验室,北京 100190

2 中国科学院计算技术研究所,北京 100190

3 中国科学院大学计算机科学与技术学院,北京 100049

4 北京市信息技术研究所,北京 100091

5 北京电子科技职业学院,北京 100176

 

 摘要近些年,知识图谱的构建技术得到了极大的发展,构建好的知识图谱已经被应用到众多领域。在此基础上,研究者将目光从知识图谱转向事件图谱。事件图谱以事件为核心,准确地描述了事件信息以及事件之间的关联关系。基于此,总结了事件图谱在构建、推理与应用方面的关键技术,主要包括事件抽取、事件信息补全、事件关系推断以及事件预测技术。给出了事件图谱的具体应用场景,并且针对事件图谱研究中存在的挑战,对未来的研究趋势进行了展望。

关键词知识图谱 ; 事件图谱 ; 事件知识 ; 事件抽取 ; 事件推理

论文引用格式:

胡志磊, 靳小龙, 陈剑赟, 等. 事件图谱的构建、推理与应用[J]. 大数据, 2021, 7(3): 80-96.

HU Z L, JIN X L, CHEN J Y,  et al. Construction, reasoning and applications of event graphs[J]. Big Data Research, 2021, 7(3): 80-96.


1 引言

随着信息技术的飞速发展,目前整个社会已经迈入了大数据时代。大数据时代下每时每刻都在产生庞大的数据。在庞大数据的背后,蕴含着众多有价值的信息。但是由于数据种类繁多、数据量庞大,难以高效、准确地获取有用的信息。为了更加高效地获取数据背后的信息,提高获取信息的效率,研究人员开始研究并使用自动化的工具从原始数据中抽取有价值的信息。这种自动化的技术被称为信息抽取技术,可以极大地提高工作效率,节省时间。与此同时,由于信息抽取技术逐渐走向成熟,一种新的数据组织形式逐渐形成,实现了知识互联,适应了用户的认知需求,其被称为知识图谱。

知识图谱的概念由Google公司在2012年正式提出,目的是提高搜索引擎的性能,提供更加友好的搜索结果。随后知识图谱在学术界受到了极大的关注,其构建技术也在飞速发展。目前,知识图谱已经被广泛地应用到知识问答、智能搜索、个性化推荐、软件复用、政府治理等多个领域。随着技术的不断发展,现有研究内容已经从知识图谱的实体识别、关系抽取技术扩展到了事件图谱的构建与推理技术。事件图谱刻画了现实世界中发生的事件,对事件信息进行了准确描述。事件图谱中蕴含众多事件知识,事件知识的特点是拥有众多维度,例如时间维度、逻辑维度、关系维度等。

本文对现有的关于事件知识的研究做了总结,从事件图谱的构建、推理与应用3个方面阐述了相关技术的研究现状。最后,本文展望了事件图谱的发展方向。

2 知识图谱与事件图谱

知识图谱本质上是一种语义网络,包含实体以及实体之间的关系。实体是知识图谱中最基本的概念,一个实体代表了现实世界中的一个事物或者一个概念。关系代表的是实体和实体之间的关联。另外,知识图谱中的属性代表的是实体具有的某个特征,其描述了实体的相关信息。知识图谱刻画了现实世界中的事物以及事物之间的各种关系,其主要表示形式是三元组,包括属性三元组和关系三元组。知识图谱存储了结构化数据,适合对数据进行搜索和推理,已经在知识问答、智能搜索等方面发挥了重要的作用。

事件是文本中包含的一种信息,其定义为在某个特定的时间以及特定的地点,由多个相关角色参与的一件事情或者一组事情。随着知识图谱技术的发展,越来越多的研究者开始关注一种特殊的基于事件的知识图谱,即事件图谱。在此基础上,本文将事件图谱定义为:一种以事件为中心,用来描述事件信息以及事件之间各种关系的图谱。事件图谱和知识图谱主要的不同点是事件图谱主要的研究对象是事件,描述了与事件相关的知识、事件的演变过程以及事件间的关联关系。而知识图谱主要的研究对象是实体,主要描述的是实体属性以及实体之间的关系。在事件图谱中,图的节点表示事件,图上的连边表示事件之间的时序、因果、顺承、包含等关系。事件图谱示例如图1所示,图1展示了收购事件、股价上涨事件和股价下跌事件的事件论元以及事件之间的关联关系。从图1中可以看到,收购事件的收购方是公司A,被收购方是公司B,收购金额是350亿美元,收购时间是2020年10月27日。另外,由于收购事件导致了股价上涨事件和股价下跌事件的发生,因此收购事件分别与股价上涨事件、股价下跌事件之间具有因果关系以及隐含的时序关系。

图1   事件图谱示例

在事件图谱的构建、推理与应用的过程中,需要用到多种智能化信息处理技术,核心技术主要包括事件抽取技术、信息补全技术、关系推断技术以及事件预测技术。面对开放网络上的文本数据,首先要做的任务是事件抽取。事件抽取技术可以从非结构化的文本数据中提取出与事件有关的信息,并将信息以结构化的形式呈现出来。而信息补全技术是利用事件图谱中已有的知识,推理补全事件图谱中缺失的事件论元知识。关系推断技术则是利用文本中的信息来推断出事件之间的共指、时序以及因果等关系。最后,事件预测技术被用来预测未来可能发生的事件,分析事件的演变趋势。构建好的事件图谱具有广阔的应用场景,主要包括热点事件检测、事件脉络分析以及未来事件预测等。

3 事件抽取

事件是文本中包含的一种特殊信息,事件抽取就是从非结构化的文本数据中抽取与事件有关的各种角色,将信息用结构化数据表示。按照确定事件类别的方法,事

  • 4
    点赞
  • 43
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值