事件抽取

事件抽取综述

一、研究背景 信息时代背景下,随着互联网的发展,商业部门、政府机构以及个人正面对着越来越多与工作、生活密切相关的文本信息,而如何从这些大量文本中挖掘潜在的有使用价值的信息,仍是一个难题。信息抽取(Information Extraction)研究正是在这种大的应用背景下应运而生的。“信息抽取任务的本质是从无结构的自然文本中识别出事实描述(包括:实体、关系、事件),并抽取出与这些事实描述相关的信息,以结构化的形式存储,供用户查询以及供研究人员进一步分析利用。

二、研究意义自然语言理解是人工智能领域的一个重要研究内容,信息抽取又一直是自然语言理解中的核心问题之一,事件抽取又是信息抽取中的一个非常困难的任务,其对于自然语言理解具有重要的研究意义。
事件抽取作为信息抽取领域的重点研究方向之一,近年来在自然语言处理领域备受瞩目,并且广泛应用在信息搜索、智能问答、自动摘要等领域。
在理论研究方面:事件抽取技术的开展与数据挖掘、机器学习和自然语言处理等多个领域都有着密切联系,在该方向的研究不但能处理事件抽取关联问题,还极大推进了相关学科的发展。
在实际应用方面:事件抽取的核心是通过结构化方式展示事件,即对于一个事件,要确定其所属类型、发生地点、时间以及具体内容,极大的提高从无结构化信息中获取重要信息的效率。

三、ACE2005关于事件抽取的相关定义在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
目前主流的事件抽取方法是基于神经网络的序列模型,把事件抽取任务转为序列标记任务,标出触发词在原文中的位置及其类型,事件论元的识别也视为相同的序列标记任务。

接下来介绍两篇基于神经网络序列模型的事件抽取论文。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
目前很多神经网络的模型,都会充分考虑字级别与词级别的信息,接下来介绍基于问答的事件抽取,运用了BERT模型。

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
目前主流的事件抽取方法还是基于神经网络的模型,基于图神经网络的模型更加先进,在准确度的提升上,主要从字,词,句子的语义考虑,还有引用外部词典来增强语义,某个领域方面的事件抽取任务还需要考虑领域背景知识。事件抽取任务至关重要,在机器的知识表识中会起到很大作用,把事件抽取出来,以结构化的方式构建一个事件知识库,就可以用来用作机器的知识表示。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值