图卷积神经网络GCN---谱图卷积层代表作

最新推荐文章于 2023-02-06 12:55:19 发布

青山白云间

最新推荐文章于 2023-02-06 12:55:19 发布

阅读量1.1k

点赞数 1

分类专栏：图卷积神经网络GCN 文章标签： gcn 深度学习卷积神经网络

本文链接：https://blog.csdn.net/weixin_35505731/article/details/105232265

版权

图卷积神经网络GCN 专栏收录该内容

14 篇文章 4 订阅

订阅专栏

Spectral-based ConvGNN

这篇博客侧重列举谱图卷积的主要发展演变，如果要从头理解建议阅读图卷积神经网络（Graph Convolutional Network）之谱卷积。

基于图谱方法的卷积是图卷积神经网络的一个重要方法。频谱方法的一个常见缺点是它们需要将整个图形加载到内存中以执行图形卷积，这在处理大图形时效率不高。[8]

1 Spectral networks and locally connected networks on graphs

[J. Bruna, 2014, 1] 和 [M. Henaff, 2015, 2]都是与Y. LeCun有关，是谱卷积图神经网络的开山之作。[J. Bruna, 2014, 1]用拉普拉斯矩阵的特征向量作图的傅里叶变换矩阵，再根据卷积定理得到最原始的谱图卷积：
$x_{k+1,j} = h \left( U \sum_{i=1}^{f_{k-1}} F_{k,i,j} U^T x_{k,i} \right) \quad (j = 1, \cdots, f_k) \tag{1.1}$
其中 $F_{k,i,j}$ 是对角阵，即可学习的卷积核， $h$ 是实非线性函数。

2 Deep convolutional networks on graph-structured data

[M. Henaff, 2015, 2] 在[J. Bruna, 2014, 1]引入了插值操作，让卷积核能够变换变大，即 $\mathcal{K}: \reals^{N_0 \times N_0} \rightarrow \reals^{N \times N}$ ：
$w_g = \mathcal{K} \tilde{w}_g \tag{2.1}$

在这里插入图片描述

此外，原文还使用了层次图聚类（Hierarchical Graph Clustering）作池化操作。

3 Convolutional neural networks on graphs with fast localized spectral filtering

[M. Defferrard, 2016, 3] 使用Chebyshev多项式作卷积核， $K - 1$ 阶的核为：
$\begin{aligned} g_{\theta} (\Lambda) &= \sum_{k=0}^{K-1} \theta_{k} T_k(\tilde{\Lambda}), \\ \tilde{\Lambda} &= \frac{2 \Lambda}{\lambda_{\max} - I_N} \end{aligned} \tag{3.1}$

巧妙地利用了对称阵的特点，化简了卷积：
$\begin{aligned} x_{k+1,j} &= h \left( U \sum_{i=1}^{f_{k-1}} g_{\theta_{i,j}} (\tilde{\Lambda}) U^T x_{k,i} \right) \\ &= h \left( \sum_{i=1}^{f_{k-1}} \left( U g_{\theta_{i,j}} (\tilde{\Lambda}) U^T \right) x_{k,i} \right) \\ &= h \left( \sum_{i=1}^{f_{k-1}} g_{\theta_{i,j}} (\tilde{L}) x_{k,i} \right) \quad (j = 1, \cdots, f_k) \end{aligned} \tag{3.2}$
直接使用拉普拉斯矩阵 $L$ 的多项式作卷积核。并且使用完全二叉树做池化。

在这里插入图片描述

4 Semi-supervised classification with graph convolutional networks

[T. N. Kipf, 2017 4] 在[M. Defferrard, 2016, 3]的基础上又做了化简。取 $\lambda_{max} \approx 2$ ，令参数 $\theta_{0}^{'} = - \theta_{1}^{'} = \theta$ ，图上谱卷积又可以简化为
$g_{\theta^{'}} \star x \approx \theta \left( I_N + D^{-\frac{1}{2}} A D^{-\frac{1}{2}} \right) x \tag{4.1}$

注意 $I_N + D^{-\frac{1}{2}} A D^{-\frac{1}{2}}$ 拥有范围为 $[0, 2]$ 的特征值，这将会导致数值不稳定性和梯度爆炸/消失。

原文提出了归一化技巧(renormalization trick)：
$I_N + D^{-\frac{1}{2}} A D^{-\frac{1}{2}} \rightarrow \tilde{D}^{-\frac{1}{2}} \tilde{A} \tilde{D}^{-\frac{1}{2}}.$
其中 $\tilde{A}=A+I_N,\tilde{D}_{i,i} = \sum_{j}\tilde{A}_{i,j}$ 。

输入 $\in \mathbb{R}^{N \times C}$ ， $C$ 为输入的通道数，经过滤波 $\Theta \in \mathbb{R}^{C \times F}$ 得到含有 $F$ 个通道的卷积后结果 $\in \mathbb{R}^{N \times F}$ ：
$\tilde{D}^{-\frac{1}{2}} \tilde{A} \tilde{D}^{-\frac{1}{2}} X \Theta$

5 Cayleynets: Graph convolutional neural networks with complex rational spectral filters

[R. Levie, 2017, 5] 与[M. Defferrard, 2016, 3]、[T. N. Kipf, 2017 4]不同，使用的是Cayley多项式做卷积核：
$\begin{aligned} g_{\vec{c},h} &= c_0 + 2 \Re \left\{ \sum_{j=1}^{r} c_j \left( h \lambda - i \right)^{j} \left( h \lambda + i \right)^{-j} \right\}, \\ \vec{x}_{k+1} &= g_{\vec{c},h}(L) \vec{x}_k \\ &= c_0 \vec{x}_{k} + 2 \Re \left\{ \sum_{j=1}^{r} c_j \left( h L - i I_N \right)^{j} \left( h L + i I_N \right)^{-j} \vec{x}_{k} \right\}. \end{aligned} \tag{5.1}$

其中 $\vec{c}=\{c_0,c_1,\cdots,c_r\},h$ 是需学习的参数。

6 Adaptive graph convolutional neural networks

[R. Li, 2018, 6] 将拉普拉斯矩阵 $L$ 参数化，把分成两部分，一部分是原始的，另一部分是优化后的：
$\hat{L} = L + \alpha L_{\text{res}}. \tag{6.1}$

参数化部分 $L_{\text{res}}$ 是与参数化的邻接矩阵 $\hat{A}$ 有关，而邻接矩阵 $\hat{A}$ 与顶点间的权重有关，因此参数化部分 $L_{\text{res}}$ 实质上由参数化的距离决定。

使用可学习参数 $M$ 的马氏距离，得到顶点间的权重（距离）：
$\begin{aligned} \mathbb{D}(x_i,x_j) &= \sqrt{\left( x_i - x_j \right)^T M \left( x_i - x_j \right)}, \\ \mathbb{G}(x_i,x_j) &= \exp \left( \frac{-\mathbb{D}(x_i,x_j)}{2 \sigma^2} \right). \end{aligned} \tag{6.2}$

卷积层为：
$\left( U \sum_{k=0}^{K-1} \left( \mathcal{F}(L,X,\Gamma) \right)^k U^T X \right)W + b. \tag{6.3}$
下图中Eq.(6)、Eq.(7)、Eq.(8)分别指的是式（6.2）、（6.3）。

在这里插入图片描述

7 Dual graph convolutional networks for graphbased semi-supervised classification

[C. Zhuang, 2018, 7] 使用了两个卷积操作：

Local Consistency Convolution: $Conv_A$ ：

$Conv_{A}^{(i)}(X) = Z^{(i)} = \sigma \left( \hat{D}^{-\frac{1}{2}} \hat{A} \hat{D}^{-\frac{1}{2}} Z^{(i-1)} W^{(i)} \right). \tag{7.1}$
其中 $\hat{A} = A + I_N, \hat{D}_{i,i} = \sum_{j} \hat{A}_{i,j}$ 。

Global Consistency Convolution: $Conv_P$ ：

$Conv_{P}^{(i)}(X) = Z^{(i)} = \sigma \left( D^{-\frac{1}{2}} P D^{-\frac{1}{2}} Z^{(i-1)} W^{(i)} \right). \tag{7.2}$

其中 $P$ 是PPMI矩阵， $D_{i,i} = \sum_{j} P_{i,j}$

要计算PPMI矩阵首先需要计算频率矩阵 $F$ ，见下图。

在这里插入图片描述
上图中的Eq.(8)指的是式（7.3）：
$p(s(t+1)=x_j|s(t)=x_i) = \frac{A_{i,j}}{\sum_{j} A_{i,j}}. \tag{7.3}$

PPMI矩阵的计算过程如下：
$\begin{aligned} p_{i,j} &= \frac{F_{i,j}}{\sum_{i,j}F_{i,j}}, \\ p_{i,*} &= \frac{\sum_j F_{i,j}}{\sum_{i,j}F_{i,j}}, \\ p_{*,j} &= \frac{\sum_i F_{i,j}}{\sum_{i,j}F_{i,j}}, \\ p_{i,j} &= \max \left\{ \text{pmi}_{i,j} = \log \left( \frac{p_{i,j}}{p_{i,*j*}, p_{*i*,j}} \right), 0 \right\}. \end{aligned} \tag{7.4}$

在这里插入图片描述

参考文献

青山白云间

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
图卷积神经网络GCN---谱图卷积层代表作

Spectral-based ConvGNN这篇博客侧重列举谱图卷积的主要发展演变，如果要从头理解建议阅读图卷积神经网络（Graph Convolutional Network）之谱卷积。基于图谱方法的卷积是图卷积神经网络的一个重要方法。频谱方法的一个常见缺点是它们需要将整个图形加载到内存中以执行图形卷积，这在处理大图形时效率不高。[8]1 Spectral networks and l...
复制链接

扫一扫