事件抽取

最新推荐文章于 2024-08-21 09:00:56 发布

西南叶孤城

最新推荐文章于 2024-08-21 09:00:56 发布

阅读量615

点赞数 1

文章标签：自然语言处理

本文链接：https://blog.csdn.net/weixin_44305190/article/details/111830742

版权

事件抽取综述

一、研究背景信息时代背景下，随着互联网的发展，商业部门、政府机构以及个人正面对着越来越多与工作、生活密切相关的文本信息，而如何从这些大量文本中挖掘潜在的有使用价值的信息，仍是一个难题。信息抽取（Information Extraction）研究正是在这种大的应用背景下应运而生的。“信息抽取任务的本质是从无结构的自然文本中识别出事实描述（包括：实体、关系、事件），并抽取出与这些事实描述相关的信息，以结构化的形式存储，供用户查询以及供研究人员进一步分析利用。

二、研究意义自然语言理解是人工智能领域的一个重要研究内容，信息抽取又一直是自然语言理解中的核心问题之一，事件抽取又是信息抽取中的一个非常困难的任务，其对于自然语言理解具有重要的研究意义。
事件抽取作为信息抽取领域的重点研究方向之一，近年来在自然语言处理领域备受瞩目，并且广泛应用在信息搜索、智能问答、自动摘要等领域。
在理论研究方面：事件抽取技术的开展与数据挖掘、机器学习和自然语言处理等多个领域都有着密切联系，在该方向的研究不但能处理事件抽取关联问题，还极大推进了相关学科的发展。
在实际应用方面：事件抽取的核心是通过结构化方式展示事件，即对于一个事件，要确定其所属类型、发生地点、时间以及具体内容，极大的提高从无结构化信息中获取重要信息的效率。

三、ACE2005关于事件抽取的相关定义在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

目前主流的事件抽取方法是基于神经网络的序列模型，把事件抽取任务转为序列标记任务，标出触发词在原文中的位置及其类型，事件论元的识别也视为相同的序列标记任务。

接下来介绍两篇基于神经网络序列模型的事件抽取论文。
在这里插入图片描述

目前很多神经网络的模型，都会充分考虑字级别与词级别的信息，接下来介绍基于问答的事件抽取，运用了BERT模型。

在这里插入图片描述

在这里插入图片描述

目前主流的事件抽取方法还是基于神经网络的模型，基于图神经网络的模型更加先进，在准确度的提升上，主要从字，词，句子的语义考虑，还有引用外部词典来增强语义，某个领域方面的事件抽取任务还需要考虑领域背景知识。事件抽取任务至关重要，在机器的知识表识中会起到很大作用，把事件抽取出来，以结构化的方式构建一个事件知识库，就可以用来用作机器的知识表示。