Relation-aware Graph Attention Model With Adaptive Self-adversarial Training论文笔记

最新推荐文章于 2024-04-03 13:49:33 发布

reallsp

最新推荐文章于 2024-04-03 13:49:33 发布

阅读量621

点赞数

分类专栏：人工智能文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/reallsp/article/details/114377503

版权

人工智能专栏收录该内容

5 篇文章 0 订阅

订阅专栏

Relation-aware Graph Attention Model With Adaptive Self-adversarial Training

Motivation

传统方法利用知识图谱嵌入（KGE）方法解决异构图的关系预测问题，或者虽然采用了GNN，但在信息传递时忽略了边的语义信息，学习到的特征表示不够理想，从而导致结果不够准确。
大部分图表示学习方法都可以统一在一个采样噪声对比估计框架中。随机负采样虽然简单有效，但由于大部分负样本很容易被区分出，所以有梯度消失的问题。许多基于GAN的采样方法可解决这个问题，其中的generator作为负样本采样器，识别出更加discriminative的关系，以供discriminator学习。然而，GAN的问题是需要更多的参数，并且难以训练。

Contribution

提出了RelGNN，一种用于异构图的基于信息传递的图注意力网络，通过加入边的语义信息，增强了图的表达能力。
提出了ASA，一种无参数的负采样方法，可以识别出难负样本，同时降低假负样本率。
在多个benchmark和工业数据集上的实验结果显示，在关系预测问题中，使用RelGNN和ASA采样比STOA方法效果更胜一筹。

Problem Definition

一个异构图可表示为 $G=(V,E,A,R,\phi)$
$V=\left\{v_1,\cdots,v_n\right\}$ 代表图中的节点集合
$A=\left\{a_1,\dots,a_k\right\}$ 代表节点的属性模式，每个节点 $v_i$ 的节点类型为 $\phi(v_i)$ ,其关联的属性模式为 $A_{\phi(v_i)}$ 为 $A$ 的一个子模式，即 $A_{\phi(v_i)}\in A$
$E=\left\{e_1,\dots,e_m\right\}$ 为一个无向边集合， $R$ 为边的类型集合
每条边 $e_k=(v_i,r_i,v_j)$ 表示 $v_i$ 和 $v_j$ 之间的关系， $r_i\in R$
此外，每对节点之间可以包含多个关系（多条边）

Method

GelGNN

如下图所示，GelGNN包含四个部分。在这里插入图片描述

Attribute Embedding

首先将节点的各个属性各自编码成向量，最终拼接在一起，再经过一个全连接层得到该节点的属性embedding向量。

Message passing

通过self-attention机制将节点属性embedding和节点图embedding组合在一起得到最终的实体embedding。

对于节点 $v_i$ ，定义其在图中的传播函数为：

$h_{v_i}^{(t)}=\sigma(\sum_{r\in R}\sum_{v_j\in N_{v_i}^r}\alpha_{(v_i,v_j)}W_r^{t-1}h_{v_j}^{(t-1)}+W_{self}^{t-1}h_{v_i}^{(t-1)})$

其中 $\sigma$ 为一个激活函数， $N_{v_i}^r$ 表示与顶点 $v_i$ 包含关系 $r\in R$ 的邻接顶点集合。 $W_r^{(t-1)}$ 是专门为顶点 $v_i$ 与顶点 $v_j$ 之间的关系 $r$ 编码的一个权重矩阵， $W_{self}^{(t-1)}$ 是编码顶点 $v_i$ 前一个时间步的embedding向量的权重矩阵。 $\alpha_{(v_i,v_j)}$ 是一个attention权重因子，这个权重因子通过如下方式求的。

$\alpha_{(v_i,v_j)}=\frac{\exp(\sigma({a_e}^\top[W_{self}^{(t-1)}h_{v_i}^{(t-1)}\|h_r\|W_r^{(t-1)}h_{v_j}^{(t-1)}]))}{\sum_{r^\prime\in R}\sum_{v_n\in N_{v_i}^{r^\prime}\exp(\sigma({a_e}^\top[W_{self}^{(t-1)}h_{v_i}^{(t-1)}\|h_{r^\prime}\|W_{r^\prime}^{(t-1)}h_{v_n}^{(t-1)}]))}}$

其中 $\cdot^\top$ 代表转置， $\|$ 代表concatenation操作， $h_r$ 编码了关系 $r$ ， $a_e$ 为单头attention的权重矩阵。扩充到多头attention机制，最终的节点特征表示计算方式为：

$h_{v_i}^{(t)}=\sigma(\frac{1}{L}\sum_{l=1}^L(\sum_{r\in R}\sum_{v_j\in N_{v_i}^r}\alpha_{(v_i,v_j)}W_r^{t-1}h_{v_j}^{(t-1)}+W_{self}^{t-1}h_{v_i}^{(t-1)}))$

其中 $L$ 为头的数量。

Final Entity Embedding

对于每一个节点 $v_i$ ，初始特征 $h_{v_i}^{(0)}$ 仅包括该节点的属性信息。通过信息传递，最后一个时间步的节点特征 $h_{v_i}^{last}$ 聚合了图拓扑结构信息。将属性特征与包含图结构的特征通过attenton机制进行组合得到该实体（节点）的最终特征表示。

$h_{v_i}^{final}=\alpha_{attr}h_{v_i}^{(0)}+\alpha_{graph}h_{v_i}^{last}$ ,

$\alpha_{attr}=\frac{\exp(\sigma(a_s^\top h_{v_i}^{(0)}))}{\exp(\sigma(a_s^\top h_{v_i}^{(0)}))+\exp(\sigma(a_s^\top h_{v_i}^{last}))}$

其中权重因子通过求softmax得到。

Adaptive Self-Adversarial Negative Sampling

负采样是一种用于近似具有庞大输出层的softmax函数的技术。它基于噪声对比估计，即好的模型可以从负信号中找出正信号。在关系预测问题中，负样本通常保持边不变而改变其中一个节点得到。
本文提出了自适应自对抗负采样方法（ASA），由于负样本是正样本的一个变体，可以通过利用好正样本来控制生成的负样本的hardness。因此，负样本选择函数如下：

$\mathop{\arg\min}_{\left\{\bar{v}_m,r,\bar{v}_n\right\}\notin E}|d_r^\prime(f^\prime(v_i)，f^\prime(v_j))-d_r^\prime(f^\prime(\bar{v}_m),f^\prime(\bar{v}_n))-\mu|$

其中 $f^\prime$ 为上文介绍的GelGNN，输出为节点的embedding向量。 $d_r^\prime$ 为一个求得分的函数，输出为两个顶点之间存在关系 $r$ 的得分score。 $\mu$ 为一个正值常量，相当于一个margin值。
通过如上方法，对于一个特定的正样本，ASA根据score值能选择出有适当hardness的负样本。

reallsp

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
Relation-aware Graph Attention Model With Adaptive Self-adversarial Training论文笔记

Relation-aware Graph Attention Model With Adaptive Self-adversarial Training相关基础知识什么是异构图？传统的同构图（Homogeneous Graph）数据中只存在一种节点和边，而异构图（Heterogeneous Graph）中可以存在不只一种节点和边。异构图的关系预测问题对于两个包含多种属性的实体（entity），预测他们之间的关系类型（relation）。在异构图中，实体对应节点，关系对应两个节点之间的边，即预测两个
复制链接

扫一扫