论文笔记：IJCAI 2020 Bilinear Graph Neural Network with Neighbor Interactions

最新推荐文章于 2021-12-31 15:01:52 发布

饮冰l

最新推荐文章于 2021-12-31 15:01:52 发布

阅读量1k

点赞数 1

分类专栏：图文章标签：神经网络深度学习数据挖掘机器学习

本文链接：https://blog.csdn.net/qq_44015059/article/details/114581376

版权

图专栏收录该内容

66 篇文章 41 订阅

订阅专栏

前言

经典的 GCN 方法选择在当前节点的邻域节点中进行频域的卷积操作，将卷积得到后的特征表示通过 weighted sum 的形式汇聚到当前节点。作者认为这种计算方式需要基于以下条件才能有效：领域节点之间没有联系。这显然不符合真实情况，同时这种粗暴的信息聚合方式忽略了邻域节点集中可能的特征交互。作者举了一个简单的例子来说明：
在这里插入图片描述
可以看出两种不同的信息聚合方式所产生的结果相差巨大。

因此，本文中着重讨论了在 GNN 中建模邻域节点之间交互关系的重要性。并且提出了一种新的卷积操作加强邻域节点之间的特征交互。该框架可以适用于不同的邻域节点信息提取操作，具有代表性的分别是 GCN 和 GAT。(其实就是优化邻域信息提取后的聚合函数）。该框架被称为 Bilinear Graph Neural Network (BGNN)。可以细分为 BGCN 和 BGAT。

论文链接：https://www.ijcai.org/Proceedings/2020/0202.pdf
github：https://github.com/zhuhm1996/bgnn

1. BGNN

直接切入主题，前面没什么好介绍的。

1.1 Bilinear Aggregator

双线性聚合器被定义为如下形式：
$BA(\{\mathbf{h}_i\}_{i \in\widetilde{\mathcal{N}}(v)})=\frac{1}{b_v}\sum_{i\in\widetilde{\mathcal{N}}(v)}\sum_{j \in \widetilde{\mathcal{N}}(v)\&i < j}\mathbf{h}_i\mathbf{W}\odot\mathbf{h}_j\mathbf{W}$
这里的不等式符号有两个作用：

避免无意义的自我特征交互
避免重复的计算

如果对推荐系统熟悉的话，可以发现作者的 idea 来自 FM 思想。

双线性聚合器的矩阵形式：
$BA(\mathbf{H,A})=\frac{1}{2}\mathbf{B}^{-1}((\widetilde{\mathbf{A}}\mathbf{HW})^2-\widetilde{\mathbf{A}}(\mathbf{HW})^2)$

推导方式可以参考论文

1.2 Proof of Permutation Invariant

本文总共提到了两种信息汇聚方法分别是：Sum 和 Bilinear Aggregator。理所当然 Sum 操作具有排列不变性，也就是该操作的变量顺序进行任意变换后，结果不变。同时在文中，作者也证明双线性解码器也满足此性质，因此可以对该操作进行集成。

2. BGNN Model

作者结合传统的 Sum 操作和双线性解码器提出了一种新的图卷积框架，写作：
$\mathbf{H}^{(k)}=BGNN(\mathbf{H}^{(k-1)},\mathbf{A})\\=(1-\alpha)\cdot AGG(\mathbf{H}^{(k-1)},\mathbf{A})+\alpha \cdot BA(\mathbf{H}^{(k-1)},\mathbf{A})$

操作图示如下：
在这里插入图片描述
接着定义一个 $K$ 层的 BGNN 框架为
$BGNN_K(\mathbf{X,A})=(1-\alpha)\cdot GNN_K(\mathbf{X,A})\\+\alpha\cdot(\sum_{k=1}^K\beta_k \cdot BA(\mathbf{X},\mathbf{A}^{(k)})),s.t.,\sum_{k=1}^K\beta_k=1$