EMNLP2020_切断前后的边：事件时序关系神经结构

最新推荐文章于 2022-10-30 19:52:41 发布

All in .

最新推荐文章于 2022-10-30 19:52:41 发布

阅读量682

点赞数

分类专栏：论文笔记文章标签： nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sunshine_10/article/details/117565870

版权

本文提出了针对事件时序关系抽取的神经模型，利用预训练模型和多任务学习解决数据稀缺问题。在MATRES数据集上，通过Scheduled Multi-Task Learning和自我训练方法，模型表现出了最优效果。

摘要由CSDN通过智能技术生成

Severing the Edge Between Before and After:Neural Architectures for Temporal Ordering of Events

Abstract
Introduction
Baseline Model
Scheduled Multi-Task Learning
Multi-task Learning
- Method
- Auxiliary Datasets
Experiments and Results
Conclusion and Future Work

Abstract

在本文中，我们提出了一种神经结构和一套事件时序关系抽取的训练方法。将一段文本中的一对事件作为模型的输入，识别它们之间的时间关系(Before、After、Equal、Vague)。事件时序关系抽取任务的一个关键挑战是标注数据的稀缺，我们的模型要么依赖于预先训模型(即Roberta，Bert或Elmo)，要么依赖于转移和多任务学习(通过利用互补的数据集)，要么依赖于自我训练技术。在英文文档的MATRES数据集上的实验取得了目前最好效果。

Introduction

事件时序关系抽取任务：预测一段文本中一对事件之间的时序关系(Figure 1)。
在这里插入图片描述

Albright (e1, came) to the State Department to (e2, offer) condolences.
奥尔布赖特向国务院表示哀悼。
(e1, came)和(e2, offer)之间的关系是Before。

事件时序关系抽取这项任务具有挑战性，需要对语言的时间方面有深刻的理解，而且带标签的数据很少。

MATRES数据集包含了256个英文文档中的13577对用时序关系标注的事件。

主要贡献

提出一种神经体系结构，可以灵活地适应不同编码器和预训练词嵌入器，以形成上下文成对的参数表示；
针对训练数据稀缺问题，通过利用互补（时间和非时间）信息来探索现有的定时多任务框架(Scheduled Mutitask-Learning，SMTL)的应用，这模拟了预训练和微调；
结合模型预测，并从中学习自我训练方法，将其与SMTL方法联合测试。

Baseline Model

baseline：RoBERTa

输入：

$X_{\left[ 0,n \right)}$ 即 $\left\{ x_0,x_1,......,x_{n-1} \right\}$ ，表示文本的 $n$ 个token序列；
子序列 $span_i$ 由 $start_i$ , $end_i$ $\in \left[ 0,n \right)$ 定义， $span_1$ 和 $span_2$ 分别表示事件 $e_1$ 和 $e_2$ 的输入对。

目标：预测事件 $e_1$ 和 $e_2$ 之间的时序关系，

流程：

模型使用wang2vec或ELMO、BERT、RoBERTa将输入表示为词嵌入；
可以选择使用LSTM或者Transformer对词嵌入进行编码，使用BERT、RoBERTa生成词嵌入的时候不使用任何编码器；最终序列标识为 $H_{\left[ 0,n \right)}$

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

All in . 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。