【图神经网络】异构时间图卷积网络HTGCN——用于社区检测

最新推荐文章于 2024-07-19 11:36:30 发布

BIT可达鸭

最新推荐文章于 2024-07-19 11:36:30 发布

阅读量3.2k

点赞数 6

分类专栏：图计算系统/图神经网络文章标签：机器学习人工智能深度学习计算机视觉图神经网络

本文链接：https://blog.csdn.net/weixin_44936889/article/details/107399923

版权

图计算系统/图神经网络专栏收录该内容

8 篇文章 22 订阅

订阅专栏

【图神经网络】异构时间图卷积网络——用于社区检测

论文地址：
摘要：
研究关键点：
核心解决方案：
几个定义：
HTGCN算法：
社区检测：
实验结果：

论文地址：

《Heterogeneous-Temporal Graph Convolutional Networks: Make the Community Detection Much Better》

摘要：

在这里插入图片描述
社区检测从本质上讲，真实世界的图形数据包含各种随时间动态变化的特性、节点和边缘类型，这使得大多数现有的社区检测方法（静态）无效。

为了解决这些问题，本文提出了混合时间图卷积网络（称之为HTGCN）来从混合时间图中检测社区。作者首先设计了一个异构GCN组件来获取每个异构图在每个时间步长的特征表示。然后，提出一个残差压缩聚合组件来表示“变化”社区的“动态”特征，然后将这些特征与当前图中提取的“静态”特征进行聚合。

即：

通过异构GCN获取异构图在每个时间步长的特征表示；
通过残差压缩聚合组件来表示“变化”社区的“动态”特征；
最后将动态特征与静态特征进行融合；

研究关键点：

关键的研究难点在于不同时间步长的异质性图中群落的动态演化。因此，除了当前图中呈现的“静态”社区外，我们还需要学习有效的动态特征表示，以便从一系列图中发现“不同”的社区。

显然，所需的特征表示应该包括两部分。其中一部分表示从当前图中提取的“静态”特征。另一部分表示“动态”特征，应该从不同时间步骤的图之间的交互中提取。这样做，不可避免地会产生一个大的稀疏特征表示空间，需要较高的计算代价。因此，如何进一步减少高计算量也是一个问题。

核心解决方案：

为了很好地解决上述研究难题，作者（首次）提出了用于社区检测任务的异构时态图卷积网络（HTGCN）。

作者首先定义计算异构邻接矩阵的计算方法，然后分别嵌入每个瞬时图的空间结构信息和节点特征。
然后，作者提出了残余压缩聚合组件(ResCAC)。该组件首先利用元路径从几个连续图中对可能属于同一社区的异质性相关节点进行采样。该采样步骤具有保存时间共同体信息的优点。然后，该组件交互节点特性并压缩这些交互特性表示。
为了同时表示时不变群落和进化群落的特征，作者还将当前图的特征与压缩的时间特征进行聚合，并通过残差连接的线性层进行聚合。
最后，提出了修正的社区检测损失函数。

几个定义：

1. 异构图：

假设图 $G = (V, E)$ ， $T_V$ 和 $T_E$ 分别代表顶点类别和边类别，如果： $T_V|+|T_E|>2$ ，则 $G$ 为异构图。

如下图所示：
在这里插入图片描述

$T_V|+|T_E|>2$ ，为异构图。

2. 异构图的邻接矩阵：

异构图 $G$ 的邻接矩阵定义为： $A_{HG}=\lbrace A_{ij}|i\in [1, m], j\in[1,n]\rbrace$ 。

其中： $m=|T_V|$ ， $n=|T_E|$ 。

注意， $A_{ij}$ 表示固定节点类型 $i$ 和边类型 $j$ 所生成的同构图的邻接矩阵，因此，异构图 $G$ 的度矩阵可定义为 $D_{HG}$ = $diag(D_{ii})$ ，其中 $D_{ii} = P_j A_{ij}$ 。即将两个相同类型 $i$ 的节点之间不同类型 $j$ 的边数相加。

3. Meta-Path（元路径）：

元路径最初用于捕获异构节点和边缘之间的关系。一般来说，元路径 $δ$ 可以定义为：

其中 $a_i$ 代表不同顶点， $e_i$ 代表不同边。

如图：
在这里插入图片描述

例如，绿色对应顶点为P，边类型对应： $A\stackrel{write}{\longrightarrow}P$ ， $P\stackrel{writed}{\longrightarrow}A$ ， $P\stackrel{published}{\longrightarrow}C$ 。

4. 问题陈述：

假设 $\mathbb{G}$ 是一些时序图数据的集合，即： $\mathbb{G}=(g^1,g^2,…,g^T)$ ，其中 $T$ 是时间步长。

假设 $g^t=(V^t,A^t_{HG},X^t,T,C^t)$ 是在 $t$ 时刻的异构图， $V^t$ 是 $g^t$ 的顶点集， $X^t\in\mathbb{R}^{N^t×D^t}$ 代表顶点集 $V^t$ 的特征矩阵， $N^t$ 代表 $g^t$ 的顶点数， $D^t$ 是 $X^t$ 的特征维度，并且 $C^t$ ={1,…,C}代表了社区的标签集合。

那么正高社区检测任务就变成了在 $g^t$ 中通过有监督的方式，预测每个顶点的社区标签，其最小化目标损失函数定义如下：
在这里插入图片描述

HTGCN算法：

在这里插入图片描述

1. 异构GCN组件：

为了嵌入空间结构信息和节点特征，作者提出了这种异构GCN组件，它将节点特征与所有one-hop邻居的特征进行卷积。卷积操作可以定义为：
在这里插入图片描述
其中：

且 $W_i$ 是权重矩阵， $X_i$ 是第 $i$ 层的特征矩阵， $\sigma$ 是 ReLU 激活函数， $A_{HG}$ 是异构邻接矩阵，一般用于表示特定节点或边类型的节点之间的邻域关系。

这个组件的输出表示为： $\mathbb{X}\in\mathbb{R}^{N×D}$ 。

2. 残差压缩聚合组件（ResCAC）：

在这里插入图片描述
在获得异构GCN组件生成的 $\mathbb{X}$ 后，提出的 ResCAC 本质上是学习能够很好地表示隐藏群落进化模式的特征表示。

2.1 元路径：

首先利用元路径从每个瞬时图中采样异质性相关的节点。直观地看，虽然节点在每个时间步长都可能加入或离开异构图，但仍然存在一些时间上是不变节点。这些保留的节点自然成为不同时间步骤的图之间的“纽带”。

因此，作者提出利用元路径对异质相关节点进行采样。

例如，根据元路径 $δ ： P \to A \to P$ ，我们可以筛选出 $g^{t-1}$ 和 $g^t$ 中存在的作者顶点（类型为A）。然后将嵌入的论文顶点（类型为P）分别采样到两个特征矩阵中，即图中中上部分黄色点矩形所表示的是同一作者对两个连续图特征矩阵，即 $X_{\delta}^t$ （对应 $g^t$ 中的 $A \to P$ 中的 $P$ ）和 $Z_{\delta}^{t-1}$ （对应 $g^{t-1}$ 中的 $P \to A$ 中的 $P$ ）。

2.2 Hadamard积：

其次，分别从特征矩阵 $\mathbb{X}^t$ 和 $\mathbb{Z}^{t-1}$ 中提取这些节点的两个子特征矩阵，对其进行Hadamard积运算，得到一个保留“变化”社区交互特征的三维张量。利用 $X_{\delta}^t$ 和 $Z_{\delta}^{t-1}$ 乘例，给出的Hadamard积和拼接后的特征矩阵为：
在这里插入图片描述
其中 $2\leq t\leq T$ ， $\mathbb{H}^t_{\delta}$ 是一个三维张量， $X_{\delta}^t\in\mathbb{X}^t$ 和 $Z_{\delta}^{t-1}\in\mathbb{Z}^t$ 分别表示异构GCN组件在时间步长 $t$ 和ResCAC在时间步长 $t - 1$ 时生成的节点的特征表示， $∣ ∣$ 为拼接算子。

注意每个三维张量是由每个元路径 $δ$ 生成的，因此三维张量数目跟元路径数目相同。

2.3 压缩：

最后再在 $\mathbb{H}^t_{\delta}$ 上进行压缩操作，如图中右侧绿色部分所示。即沿特征维数方向对各层进行一维卷积运算，将三维张量压缩为二维张量 $Z^t$ ，计算公式为：
在这里插入图片描述
其中：

是第 $k$ 层的一维卷积， $N^t_{\delta_i}$ 是在 $t$ 时刻元路径 $\delta$ 上的顶点数， $∣ M ∣$ 是元路径的数目， $\sigma$ 是 $s i g m o i d$ 激活函数。

同时为了区分不同特征表示的权重，作者还在 $Z^t$ 上加一个注意分量，计算出相应的系数矩阵为：
在这里插入图片描述
其中 $\hat{W}\in\mathbb{R}^{d_a}$ 和 $\hat{V}\in\mathbb{R}^{d_a×d}$ 是参数矩阵，那么带有权重的输出就表示为：

为了避免高昂的计算成本和梯度消失问题，自然的选择是采用ResNet结构。因此，作者将原始特征矩阵加到模型输出 $\hat{Z}^T$ 上，有：

在这里插入图片描述

3. 伪代码：

整个算法的伪代码如图：
在这里插入图片描述

社区检测：

为了将该模型用于社区检测，作者定义了一个类似于[Chen et al.， 2019]的社区检测损失函数。在不损失一般性的前提下，本文考虑了非重叠社区检测问题。

根据[Chen et al.， 2019]，对于社区检测，节点标签应满足排列等方差性质，因此损失函数应根据节点标签的排列来设计。因此作者使用 $s o f t m a x (\cdot)$ 函数，用于输出特征表示 $\mathbb{Z}^t$ 。假设 $\hat{c}_i$ 为顶点 $i$ 的预测社会标签， $c_i$ 表示顶点的真实社会标签， $S_C$ 表示排列，那么就可以给出该模型的损失函数：
在这里插入图片描述