《StructPool Structured Graph Pooling via Conditional Random Fields》阅读笔记

斯曦巍峨

已于 2022-05-21 09:43:41 修改

阅读量516

点赞数

分类专栏： Graph Learning 文章标签：深度学习 GNN 条件随机场图池化

于 2022-05-21 09:35:44 首次发布

本文链接：https://blog.csdn.net/qq_42103091/article/details/124894419

版权

Graph Learning 专栏收录该内容

26 篇文章 17 订阅

订阅专栏

本文提出了STRUCTPOOL，一种新的图池化技术，将图池化转化为节点聚类问题。通过结合节点特征和拓扑信息，利用条件随机场学习簇分配，从而生成更具有表达力的图表示。实验表明，STRUCTPOOL在多个数据集上表现出优越性能，尤其在考虑高阶图结构时效果更佳。该方法可以被集成到图神经网络中，提升图分类任务的预测能力。

摘要由CSDN通过智能技术生成

一.概述

本文作者提出了一种获取图级（graph-level）表示的新图池化（graph pooling）——STURCTPOOL。通过STRUCTPOOL将图池化视为节点聚簇问题，通过其可以对原始图的节点进行聚簇，然后基于此生成一个新图，新图上的每个节点都由原始图上一个簇的节点生成。在聚簇的过程中，不仅考虑了节点的特征，还考虑了其它节点的簇分配（一种拓扑信息，通过条件随机场获得）。作者在多个数据集上进行实验，证明了通过STRUCTPOOL可以获取到更具表达力的图表示。

二.STRUCTURED GRAPH POOLING

2.1 图和图卷积的定义

图：图 $G$ 可以用其邻接矩阵 $\{0,1\}^{n \times n}$ 和特征矩阵 $\in \mathbb{R}^{n \times c}$ 表示，其中 $n$ 表示图中的节点数， $c$ 表示节点特征的维数。

作者使用的图卷积与标准的GCN略有不同，其公式如下所示：
$X_{i+1}=f\left(D^{-1} \hat{A} X_{i} P_{i}\right) \tag{1}$
其中 $\hat{A} = A + I$ 表示加了自环的邻接矩阵， $X_i \in \mathbb{R}^{n \times c_i}$ 表示第 $i$ 个卷积层后的节点表示， $P_i \in \mathbb{R}^{c_i \times c_{i + 1}}$ 是可学习的特征变换矩阵， $f$ 表示非线性激活函数。

2.2 通过节点聚簇进行图池化

作者考虑通过节点聚类（node clustering）来进行图池化。原始图 $G$ 中的节点被划分到 $k$ 个簇中，每个簇都被转换为新图上的一个节点。假定图池化生成一个包含 $k$ 个节点的新图 $\tilde{G}$ ，该图对应的表示为 $\tilde{X} \in \mathbb{R}^{k \times \tilde{c}}$ 和 $\tilde{A} \in \{0,1\}^{k \times k}$ 。

聚簇问题可以被表示为一个分配矩阵 $\in \mathbb{R}^{n \times k}$ 。对于硬分配， $m_{i,j} \in \{0,1\}$ 表示是否节点 $i$ 属于簇 $j$ 。对于软分配， $m_{i,j} \in [0,1]$ 表示节点 $i$ 属于簇 $j$ 的概率，且 $\sum_{j}m_{i,j} = 1$ 。

原始图到新图 $\tilde{G}$ 的转换公式如下：
$\tilde{X}=M^{T} X, \tilde{A}=g\left(M^{T} A M\right) \tag{2}$
其中 $g(\cdot)$ 是一个函数，当 $\tilde{a}_{i,j} > 0$ 时， $g(\tilde{a}_{i,j})=1$ ，否则 $g(\tilde{a}_{i,j})=0$ 。

2.3 通过条件随机场学习簇分配

节点特征描述了不同节点属性，具有相似特征的节点有更高的概率被分配到同一个簇里。也就是说，任何节点的簇分配不仅依赖于节点的特征矩阵 $X$ 还取决于其它节点的簇分配。作者认为高阶图结构信息对于graph pooling是有用的，应该在学习簇分配时被显式捕获。为此作者提出名为STRUCTPOOL的图池化，其考虑通过特征矩阵 $X$ 和不同节点分配间的关系来生成分配矩阵。作者将其表示为条件随机场（Conditional Random Field, CRF）问题。

以 $X$ 为观测值，定义 $Y = \{Y_1,...,Y_n\}$ 为随机场，其中 $Y_i \in \{1,...,k\}$ 是一个随机变量，表示节点 $i$ 被分配的簇，则
$\mid X)=\frac{1}{Z(X)} \exp \left(-\sum_{c \in C_{G^{\prime}}} \psi_{c}\left(Y_{c} \mid X\right)\right) \tag{3}$
其中 $c$ 表示一个团， $C_{G'}$ 表示 $G^{'}$ 上的团集合。 $Z (X)$ 是划分函数， $\psi_c(\cdot)$ 是由 $c$ 诱导的势（potential）函数。然后对一个分配 $y=\{y_1,...,y_n\}$ 的Gibbs能量函数可以定义为：
$\sum_{c \in C_{G'}} \psi_c(y_c | X) \tag{4}$
寻找一个最优分配相当于最大化 $P (Y ∣ X)$ ，也相当于最小化Gibbs能量。

2.4 带拓扑信息的Gibbs Energy

$C_{G'}$ 表示在图 $G^{'}$ 上定义的团集（clique set），作者使用 $C_{G'}$ 上的一元（unary）团（只包含一个节点的团）。作者基于** $\ell$ -hop连接性**来定义成对的团。 $A^{\ell} \in\{0,1\}^{n \times n}$ 表示图 $G$ 的 $\ell$ -hop连接性，若 $a^{\ell}_{i,j}=1$ ，则表示节点 $i$ 和节点 $j$ 在 $\ell$ -hop内可达。因此若 $\in C_{G'}$ 是成对团，则 $a^{\ell}_{i,j}=1$ 。基于此，关于簇分配 $y$ 的Gibbs能量可以形式化为：
$E(y)=\sum_{i} \psi_{u}\left(y_{i}\right)+\sum_{i \neq j} \psi_{p}\left(y_{i}, y_{j}\right) a_{i, j}^{\ell} \tag{5}$
其中

$\psi_{u}\left(y_{i}\right)$ 表示节点 $u$ 分配给簇 $y_i$ 的一元能量。
$\psi_{p}\left(y_{i}, y_{j}\right)$ 为成对能量，表示将节点 $i, j$ 分别分配给簇 $y_i,y_j$ 的能量。

为了简单起见，公式(5)中去掉了条件 $X$ 。

作者使用神经网络来获取上述两种能量。

对于一元能量 $\Psi_{u} \in \mathbb{R}^{n \times k}$ ，作者在节点特征矩阵 $X$ 上应用多层图卷积来获取。

已经工作采用高斯核来计算成对能量，基于此成对能量可以被表示为：
$\psi_{p}\left(y_{i}, y_{j}\right)=\mu\left(y_{i}, y_{j}\right) \sum_{m=1}^{K} w^{(m)} k^{(m)}\left(x_{i}, x_{j}\right) \tag{6}$
其中 $k^{(m)}(\cdot, \cdot)$ 表示第 $m$ 个高斯核， $x_i$ 即节点 $i$ 在 $X$ 中对应的特征向量， $w^{(m)}$ 是可学习的权重参数， $\mu(y_i,y_j)$ 是相容性（compatibility）函数，可以用来建模不同分配对间的相容性。但由于精确计算高斯核的输出计算效率比较低，因此作者提出用注意力矩阵来作为成对能量的度量。高斯核反映了不同特征向量之间的联系有多强，注意力矩阵反映了不同特征向量之间的相似性，这两者有相似之处，且后者的计算成本显著降低。基于此，成对能量定义如下：
$\psi_{p}\left(y_{i}, y_{j}\right)=\mu\left(y_{i}, y_{j}\right) \frac{x_{i}^{T} x_{j}}{\sum_{k \neq i} x_{i}^{T} x_{k}} \tag{7}$
作者指出公式(5)的优化是比较困难的，因此使用了一种平均场近似（mean field approximation），它是一种迭代更新算法。作者使用mean field approximation可以获取最可能的簇分配。

2.5 STRUCTPOOL总结

STRUCTPOOL算法如下所示：

algorithm

作者指出该算法可以用GNN操作来实现：

一元能量矩阵 $\Psi$ 可以通过几层GCN卷积来获取；
正则化操作（Algorithm1中的3&9）等价于softmax操作；
相容性函数 $\mu(i,j)$ 可以实现为可训练矩阵 $\mathcal{N} \in \mathbb{R}^{k \times k}$ ；
其它步骤可以通过矩阵乘法来实现。

STRUCTPOOL可视化为：

visual

其中原始图 $G$ 包含6个节点，颜色表示其特征，从该图可以看出一元能量矩阵是通过GCNs获取的，成对能量是使用节点特征 $X$ 和拓扑信息 $A$ 获取的注意力矩阵。然后执行迭代更新，通过mean field approximation来生成最可能的分配矩阵。最终得到新生成的图 $\tilde{G}$ 。

在图分类中，首先通过STRUCTPOOL可以获取到每个图的 $k$ 个向量，然后应用1维卷积和全连接层来进行分类。

三.实验

测评的benchmark数据集统计特征如下：

dataset

不同池化技术的结果为：

pools

结论：STRUCTPOOL处于SOTA地位。

不同迭代更新次数的结果为：

itera

结论：随着迭代次数的增加，性能也变得更好。

拓扑信息的影响实验结果为：

topology

结论： $\ell$ 越大，更多的成对关系被考虑，性能越好。

在GIN中整合STRUCTPOOL结果为：

gins

结论：在GIN中加入STRUCTPOOL可以显著提升预测性能。

斯曦巍峨

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
2
评论
《StructPool Structured Graph Pooling via Conditional Random Fields》阅读笔记

一.概述本文作者提出了一种获取图级（graph-level）表示的新图池化（graph pooling）——STURCTPOOL。通过STRUCTPOOL将图池化视为节点聚簇问题，通过其可以对原始图的节点进行聚簇，然后基于此生成一个新图，新图上的每个节点都由原始图上一个簇的节点生成。在聚簇的过程中，不仅考虑了节点的特征，还考虑了其它节点的簇分配（一种拓扑信息，通过条件随机场获得）。作者在多个数据集上进行实验，证明了通过STRUCTPOOL可以获取到更具表达力的图表示。二.STRUCTURED GRAPH
复制链接

扫一扫