阅读笔记 Fine-Grained Temporal Relation Extraction

最新推荐文章于 2023-07-04 19:33:48 发布

Ottohcc

最新推荐文章于 2023-07-04 19:33:48 发布

阅读量1k

点赞数

分类专栏：时序关系文章标签：深度学习 nlp

本文链接：https://blog.csdn.net/qq_40187381/article/details/109404196

版权

2019 ACL《细粒度时序关系抽取》(Fine-Grained Temporal Relation Extraction) 的阅读笔记

一、问题

事件时序关系抽取是一个很有意义的研究方向，该领域目前的工作还是将其视为一个分类问题，标注成对的事件表达和时间表达，并进行时序关系分类。这种方法的缺点是时间表达往往依赖于显式存在的持续时间信息，但是，几乎所有的时间持续信息都可以不直接存在于句中。所以在这种方法下，一般只能对可以被识别的时间持续信息进行编码。

这篇文章中，作者开发了一种新型的框架将事件持续时间放在时序关系表示的首部或中部，将事件映射射到可能的持续时间上，并将事件对直接映射到实际值的相对应时间线。在这种做法下，不仅提升了事件持续时间在判断时序关系时的重要性，同时也帮助我们更好的判断在一整段文字下的多个复杂事件的时序结构。

在这里插入图片描述

二、方案

1.数据收集

在这里插入图片描述

作者收集了 Universal Decompositional Semantics Time（UDS-T）数据集，该数据集在 Universal Dependents English Web Treebank（UD-EWT）之上标注。

具体数据标注步骤如下：

作者首先使用 Predpatt 从 UD-EWT 中提取谓词
将其中相邻句子连接起来
给标注者两个连续的句子，并带有两个突出显示的事件引用表达式（谓词），要求标注者做到以下三点：
- 为突出显示的谓词所指的事件对提供有界刻度的相对时间线
- 从以下列表中得出谓词所指事件的可能持续时间： instantaneous, seconds, minutes, hours, days, weeks, months, years, decades, centuries, forever
- 标注者须对其上述两点标注行为作出打分（0-4，分数越高代表越有信心）
对标注者做出的标注进行归一化（Normalization）如图 3 所示，先发生事件 $e_1$ 的开始在 0 一端，后发生事件 $e_2$ 的结束在 1 一端。

在这里插入图片描述

作者将每对事件对滑块（silder）定义为四个维度

（1）先后顺序（PRIORITY），当 e1 早于 e2 开始和/或结束时为正，否则为负；
（2）包含量（CONTAINMENT），当 e1 含有更多的 e2 时越大；
（3）相等性（EQUALITY），当 e1和 e2 的时间范围相同时，相等性最大，当它们最不相等时最小；
（4）SHIFT，即事件在时间轴上向前或向后移动。

并通过以下这个方程中 $\mathbf R$ 的解得出这四个维度

$\mathbf R \begin{bmatrix}-1&-1&1&1\\-1&1&1&-1\\-1&1&-1&1\\1&1&1&1\end{bmatrix} = 2\mathbf S -1$