论文笔记 ACL 2022|Document-Level Event Argument Extraction via Optimal Transport

hlee-top

已于 2023-07-11 16:27:41 修改

阅读量130

点赞数

分类专栏： NLP 论文文章标签：事件论元抽取

于 2022-10-31 14:23:46 首次发布

本文链接：https://blog.csdn.net/o11oo11o/article/details/127612382

版权

125 篇文章 15 订阅

订阅专栏

125 篇文章 12 订阅

订阅专栏

论文题目：Document-Level Event Argument Extraction via Optimal Transport
论文来源：ACL 2022
组织机构：俄勒冈大学
论文链接：https://aclanthology.org/2022.findings-acl.130.pdf

任务定义：给定触发词和候选论元，通过分类得到论元对应的角色。
模型包括下面4部分：

Input Encoder：编码包括两个部分：Bert得到的词向量；随机初始化的距离编码(到触发词和候选论元的距离)，然后通过BiLSTM编码。
Dependency Pruning：首先使用Stanford CoreNLP parser工具得到句子的依赖解析树，相邻句子的root节点进行连接，得到一个文档的依赖解析树(包含文档中全部的词)。由于整个树包括不相关词带来的噪音，使用Optimal Transport联合考虑句法(到触发词和候选论元的最小距离)和语义(Euclidean distance)进行词分配(两个集合x,y，y中添加一个空结点，与空结点对其的x数据进行裁剪)，最后通过GCN对裁剪过的图进行编码( $H^{'} = GCN (H, T^{'})$ )。
Regularization：为了编码相关的上下文词和排除不相关词的噪声，进行正则化。对未裁剪的图使用相同的GCN编码( $H^{''} = GCN (H, T)$ )，进行max_pooling,最小化两者的距离，公式如下。