当GNN遇见NLP(十二)：Relation-aware Graph Attention Networks with Relational Position Encodings for ER

最新推荐文章于 2023-03-19 14:15:00 发布

五月的echo

最新推荐文章于 2023-03-19 14:15:00 发布

阅读量755

点赞数 1

分类专栏： GNN NLP 文章标签：自然语言处理神经网络深度学习

本文链接：https://blog.csdn.net/qq_36618444/article/details/120781640

版权

GNN NLP 专栏收录该内容

18 篇文章 47 订阅

订阅专栏

在这里插入图片描述

Method

依旧是一篇emotion recognition in conversations (ERC)的文章，因此不对背景进行过多的介绍。因为基于图的神经网络没有考虑话语中包含的顺序信息，本文提出了关系位置编码，为RGAT（关系图注意力网络）提供反映关系图结构的顺序信息。总体的结构如图所示：
在这里插入图片描述
模型一共分为三部分：contextual utterance embedding, speaker dependency
modeling with position encodings and emotion classification。

Contextual Utterance Embedding

通过Bert将对话中的每一个utterance中的单词转化为token的向量化表示，并使用最大池化得到utterance的表示 $h_i^{(0)}, i=1,2,...,M$ 。这里 $M$ 表示speaker的数量。

Speaker Dependency Modeling with Position Encodings

Graphical Structure

接下来，为一个对话构建多关系的图结构。节点就是通过Bert得到的utterance的向量化表示，边则通过如下方式定义：
Labeled Edges Representation。边的类型主要依赖于两点：说话人依赖——这取决于自我依赖和说话人之间的依赖；时间依赖——这也取决于对话中的时间变化。也就是一个utterance $u_j$ 是在目标话语 $u_i$ 的过去还是未来发出的，这回产生不同的影响。基于此，构建出四种类型的边：

self - past type（ $r_1$ ）
inter - past type（ $r_2$ ）
self - future type（ $r_3$ ）
inter - future type（ $r_4$ ）

然后，使用两种不同的滑动窗口 $p, f$ 分别针对past以及feature的边，窗口内的utterance节点根据共现关系以及past或是feature关系进行构建。

EdgeWeight

在这里插入图片描述
接下来借助不同的关系进行GAT传播。 $\alpha_{ijr}$ 表示节点 $i, j$ 在关系 $r$ 下的注意力。LRL是LeakyReLU。

Position Encodings

接下来不同边的相对位置信息进行位置编码。本文唯一有难度的点在这里。为什么叫相对位置编码呢？是因为对于当前的节点 $i$ ，要考虑与其邻居的相对距离，这个Transformer差不多。并且，由于RGAT是基于不同的关系类别的，因此需要为不同的关系设计不同的位置编码方式。具体看公式：
在这里插入图片描述
这里的 $N^1(i)$ 当然表示关系 $1$ 的邻居，所以每一种相对编码只针对某一种特定的关系。同样，这里还需要考虑past或是feature的不同，不能计算超过这个窗口的节点，因为窗口外部的节点是不予考虑的。下图说明了本文的编码与其他编码方式的不同：
在这里插入图片描述
接下来，需要子啊RGAT进行注意力聚合的时候将PE也考虑进去，也就是将公式(1)修改为：

用图描述一下：

接下来，就是基于关系注意力的聚合了：

（4）表示同一种关系类别下的聚合；（5）表示不同关系之间的聚合。

Emotion Classification

经过 $L$ 层之后，将 $h_i^{(0)}$ 与 $h_i^{(L)}$ 拼接起来进行转换分类：
在这里插入图片描述

实验

数据集是老四样：
在这里插入图片描述
实验结果：

消融实验：

这里，对比了不同的编码方法，以及不同的GAT方式。本文的方法在每个类别的平均结果中取得了最好的效果。
接下来，还需要验证本文的PE的有效性：

可以看到Figure2中给出的几种PE方法，还是本文给出的最有效。
past以及feature窗口大小的选择：
在这里插入图片描述
像是这种窗口大小的选择一般都是类似倒U变化的，大家看看就好。

五月的echo

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
当GNN遇见NLP(十二)：Relation-aware Graph Attention Networks with Relational Position Encodings for ER

Method依旧是一篇emotion recognition in conversations (ERC)的文章，因此不对背景进行过多的介绍。因为基于图的神经网络没有考虑话语中包含的顺序信息，本文提出了关系位置编码，为RGAT（关系图注意力网络）提供反映关系图结构的顺序信息。总体的结构如图所示：模型一共分为三部分：contextual utterance embedding, speaker dependencymodeling with position encodings and emotio.
复制链接

扫一扫