论文浅尝 | 用于文档级事件关系抽取的稀疏事件表示的判别推理

本文介绍了一个名为SENDIR的模型,用于文档级事件关系抽取。通过学习稀疏事件表示,区分句内和句间推理,模型能够在不依赖先验知识的情况下捕获长距离依赖关系,提升DERE任务的性能。
摘要由CSDN通过智能技术生成

41942bc7eeb41f65c9efa8abb1d377db.png

笔记整理:邹铭辉,天津大学硕士,研究方向为自然语言处理

链接:https://aclanthology.org/2023.acl-long.897

动机

文档级事件关系抽取(Document-level Event-Event Relation Extraction,简称DERE)旨在从文档中提取事件之间的关系。相较于传统的句子级任务(SERE),它涉及更加复杂的长文本理解。为了更好地进行文档级推理,不同于现有方法通过语言工具构建事件图,本文工作更关注文档本身的性质,并且不依赖于任何先验知识。为了做到这一点,作者强调以下关键问题:(1)如何捕捉可能相距较远的事件依赖关系?(2)考虑到SERE和DERE之间的本质差异,是否应该将所有事件对同等对待?为了解决这些问题,作者提出了一种新颖的DERE模型,该模型学习稀疏的事件表示,用于区分句内和句间推理,即SENDIR(Sparse EveNt representations for Discriminating Intra- and inter-sentential Reasoning)。其基本思想是通过假设同一句子中或跨越多个句子的事件对具有不同的信息密度来区分它们:(1)文档中的低密度暗示着对不相关信息的稀疏注意。本文模型的模块1设计了各种类型的注意力机制来学习事件表示,以捕捉远距离依赖关系。(2)句子中的高密度使得SERE相对较容易。本文模型的模块2使用不同的权重来强调句内和句间推理的作用和贡献,从而为联合建模引入了支持性事件对。大量实验证明了SENDIR的显著改进以及各种稀疏注意力在文档级表示上的有效性。

亮点

本文亮点主要包括:

(1)考虑到DERE和SERE任务的本质差异,提出了区分句内推理和句间推理的想法;

(2)本文提出的SENDIR模型关注文档本身的性质,而无需任何的先验知识和外部工具。

模型与方法

afb814a3dd196ae5c03102bebdbc8645.png

SENDIR旨在学习高质量的事件表示,以促进句内和句间推理。如图2所示,模型框架有四个主要组件:(1)编码器(Encoder)用于将文档编码为向量࿰

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值