异构神经网络（3）MAGNN: Metapath Aggregated Graph Neural Network for Heterogeneous Graph Embedding

最新推荐文章于 2024-06-08 09:45:38 发布

文件夹66

最新推荐文章于 2024-06-08 09:45:38 发布

阅读量1.4k

点赞数 1

分类专栏：图神经网络文章标签：神经网络机器学习

本文链接：https://blog.csdn.net/qq_42275073/article/details/113497209

版权

图神经网络专栏收录该内容

10 篇文章 12 订阅

订阅专栏

MAGNN: Metapath Aggregated Graph Neural Network for Heterogeneous Graph Embedding这篇文章发表于WWW 2020。

Motivation

现在GNN（图神经网络）体系中先进的方法都假设输入是同构图，无法用于异构图的嵌入表示。现存的异构图嵌入方法都是基于meta-path的概念（具体概念可以参考前两篇异构神经网络论文），但这些方法都存在至少以下的一个问题：

模型没有利用节点的内容信息特征，所以往往对于节点信息丰富的异构图，表现的不是很好；
模型舍弃了meta-path的所有中间节点，而只考虑两个端节点，这样会造成信息丢失（比如这篇）；
模型依赖于一个单独的meta-path来编码异构图，需要一个手动的选择meta-path的过程，这样就损失了其他meta-path的信息，导致了不太好的效果。

Contribution

使用了node content transformation，映射异构节点的属性到同一个潜在向量空间；
对每个meta-paht使用intra-metra aggregation（with attention mechanism），同时聚合了邻居节点（meta-path的另一端节点）和在邻居节点之间的内容信息（meta-path上的中间节点）；
使用inter-meta aggregation（with attention mechanism），聚合多个meta-path的潜在嵌入向量，得到最终的节点embeddings。

Preliminary

异构图： $\mathcal{G}=(V,\mathcal{E})$ ， $A$ 表示节点类型集合， $R$ 表示边类型集合。
meta-path： $A_1 \stackrel{R_1}{\rightarrow}A_2 \stackrel{R_2}{\rightarrow}\ldots\stackrel{R_{l}}{\rightarrow}A_{(l+1)}$
表示节点类别 $A_1 A_{l+1}$ 之间的一种组合关系： $R=R_1\circ R_2 \circ \ldots\circ R_l$ ，比如两个电影之间的关系，MAM，表示movie-actor-movie，两个电影都有同一个演员；MDM，表示movie-director-movie，两个电影是同一个导演。
meta-path instance：对于meta-path $P$ ，其instance $p$ 表示遵循 $P$ 模式定义的节点序列；
meta-path neighbor： $N_v^P$ 表示节点 $v$ 经过 $P$ 的meta-instance 与节点 $v$ 相连的节点；
metapath-based graph： $\mathcal{G}^P$ 表示所有基于meta-path $P$ 的节点对构成的图，如果P是对称的，那么 $\mathcal{G}^P$ 是同构图；
heterogeneous graph embedding：对于异构图 $\mathcal{G}=(V,\mathcal{E})$ ，节点特征为 $X_{A_i}∈R^{|V_{A_i}|×d_{A_i}}$ ， $A_i$ 表示节点类别，异构图嵌入的任务是对于所有节点 $v$ 学习 $h_v∈R^d$ ，且这个嵌入能捕捉到图 $\mathcal{G}$ 丰富的结构和语义信息。

Model

Node Content Transformation

这一步是为了便于后续的聚合操作，对于不同的节点特征，学习对应的映射向量，将不同类别的节点特征向量映射到同一个特征空间中。

不同类别的节点有着不同维度的特征向量，即使这些特征向量在相同的维度，但也许是不同的特征空间。所以首先需要映射不同类别的节点特征到相同的潜在空间中。
对于节点 $v∈V_A$ ，也就是类别为 $A$ 的节点，其映射为：
$h_v'=W_A·x_v^A\tag{1}$ $x_v^A$ 表示节点 $v$ 的原始特征向量， $h_v'$ 表示映射后的潜在特征向量。

Intra-metapth Aggregation

这一步是为了学习与 $v$ 相连的同一个metapath的信息，包括the meta-path based neighbors和the context between。首先是编码metapath instances。
编码的做法是下式，具体设计在后续会介绍：
$h_{P(v,u)}=f_\theta(P(v,u))=f_\theta(h_v',h_u',\{h_t',\forall t∈\{m^{P(v,u)}\}\})\tag{2}$
在得到基于 $P$ 的编码后，需要聚合所有与目标节点 $v$ 相关的metapath instances $P$ 的编码，具体的做法是针对每个metapath $P$ ，学习归一化的权重 $\alpha^P_{vu}$ ：
$\begin{aligned} e_{v u}^{P} &=\text { LeakyReLU }\left(\mathrm{a}_{P}^{T} \cdot\left[\mathbf{h}_{v}^{\prime} \| \mathbf{h}_{P(v, u)}\right]\right)\\ \alpha_{v u}^{P} &=\frac{\exp \left(e_{v u}^{P}\right)}{\sum_{s \in \mathcal{N}_{v}^{P}} \exp \left(e_{v s}^{P}\right)} \\ \mathbf{h}_{v}^{P} &=\sigma\left(\sum_{u \in \mathcal{N}_{v}^{P}} \alpha_{v u}^{P} \cdot \mathbf{h}_{P(v, u)}\right) \end{aligned}\tag{3}$ 同样，作者也给出了multiple head attention的表示。
从而得到了节点 $v$ 对于metapath $P$ 的表示。

Inter-metapath Aggregation

这一步是为了学习聚合不同metapath的信息。
对于节点类别 $A$ ，metapaths集合 $P_A=\{P_1,P_2,\ldots,P_M\}$ ，在上一步中分别学习到了其潜在的表示向量 $\{h_v^{P_1},h_v^{P_2},\ldots,h_v^{P_M}\}$ 。

首先，平均所有节点 $v∈V_A$ ，关于特定的metapath $P_i$ 潜在表示向量，得到 $s_{P_i}$ 。 $\mathbf{s}_{P_{i}}=\frac{1}{\left|\mathcal{V}_{A}\right|} \sum_{v \in \mathcal{V}_{A}} \tanh \left(\mathbf{M}_{A} \cdot \mathbf{h}_{v}^{P_{i}}+\mathbf{b}_{A}\right)$
$M_A$ 和 $b_A$ 是可学习参数，用于嵌入表示的线性变换。
然后使用注意力机制，来学习metapath $P_i$ 对于类别 $A$ 的节点的重要性，用 $\beta_{P_i}$ 表示。 $\begin{array}{l} e_{P_{i}}=\mathrm{q}_{A}^{\top} \cdot \mathrm{s}_{P_{i}} \\ \beta_{P_{i}}=\frac{\exp \left(e_{P_{i}}\right)}{\sum_{P \in \mathcal{P}_{A}} \exp \left(e_{P}\right)} \\ \mathbf{h}_{v}^{\mathcal{P}_{A}}=\sum_{P \in \mathcal{P}_{A}} \beta_{P} \cdot \mathbf{h}_{v}^{P} \end{array}$
得到了聚合 $P_A$ 中所有metapath后的，节点 $v$ 的表示 $h_v^{P_A}$ 。
最终，再用一个线性变换和非线性变换来映射到最终的输出维度： $\mathbf{h}_{v}=\sigma\left(\mathbf{W}_{o} \cdot \mathbf{h}_{v}^{\mathcal{P}_{A}}\right)$

Metapath Instance Encoders

介绍了平均、线性以及relational rotation encoder，用于聚集metapath instance中端节点和中间节点的信息。
前面两种方法认为metapath instance是一个集合，而忽略了其中的序列结构。最后一种则考虑了instance内部的序列关系： $\begin{array}{l} o_{0}=h_{t_{0}}^{\prime}=h_{u}^{\prime} \\ o_{i}=h_{t_{i}}^{\prime}+o_{i-1} \odot \mathbf{r}_{i} \\ h_{P(v, u)}=\frac{o_{n}}{n+1} \end{array}$

文件夹66

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
异构神经网络（3）MAGNN: Metapath Aggregated Graph Neural Network for Heterogeneous Graph Embedding

MAGNN: Metapath Aggregated Graph Neural Network for Heterogeneous Graph Embedding这篇文章发表于WWW 2020。Motivation现在GNN（图神经网络）体系中先进的方法都假设输入是同构图，无法用于异构图的嵌入表示。现存的异构图嵌入方法都是基于meta-path的概念（具体概念可以参考前两篇异构神经网络论文），但这些方法都存在至少以下的一个问题：模型没有利用节点的内容信息特征，所以往往对于节点信息丰富的异构图，表现的
复制链接

扫一扫