【论文阅读】Hypergraph Neural Networks

最新推荐文章于 2023-11-23 21:22:05 发布

六九八

最新推荐文章于 2023-11-23 21:22:05 发布

阅读量1.7k

点赞数 2

分类专栏： paper 文章标签：超图神经网络

本文链接：https://blog.csdn.net/qq_43955154/article/details/121478383

版权

paper 专栏收录该内容

12 篇文章 3 订阅

订阅专栏

Hypergraph Neural Networks

超图学习部分
超图上的谱卷积
实现
实验
- 引文网络分类
- 视觉对象识别

超图学习部分

定义超图 $\mathcal{G=(V,E,}W)$ ，分别代表顶点、超边、权重。
超图可以用关联矩阵 $H$ 来表示：
$h(n,\theta) = \begin{cases} 1, & \text{if } v\in e\\ 0, & \text{otherwise} \end{cases}$

节点的度 $d(v)=\sum_{e\in \mathcal{E}}w(e)h(v,e)$
超边的度 $\delta(e)=\sum_{v\in \mathcal{V}}h(v,e)$

超图顶点分为问题，可以被表示为一个正则化框架：
该公式可查看另一篇论文：超图的二分类论文
$min_f\left\{R_{emp}(f)+\Omega(f)\right\}$
其中 $R_{emp}(f)$ 为经验损失： $R_{emp}(f)=\frac{1}{N}\sum_{i=1}^NL(y_i,f(x_i))$

$\Omega(f)$ 为超图上的正则化函数： $\Omega(f)=\frac{1}{2}\sum_{e\in \mathcal{E}}\sum_{u,v \in \mathcal{V}}\frac{w(e)h(u,e)h(v,e)}{\delta (e)}(\frac{f(u)}{\sqrt{d(u)}}-\frac{f(v)}{\sqrt{d(v)}})^2$
上式可以简化为：
$\Omega(f)=f^T\Delta f$
其中 $\Delta=I-L$ ， $L=D^{-1/2}_vHWD_e^{-1}H^TD^{-1/2}_v$

超图上的谱卷积

附上一个普通图的谱卷积：如何理解GCN（大神写的太好了！入门也可以看）

超图的傅里叶变换

对拉普拉斯矩阵进行特征分解，特征向量矩阵 $\Phi=diag(\phi_1,...,\phi_n)$ ，特征值矩阵 $\Lambda=diag(\lambda_1,...,\lambda_n)$ ，特征值均为非负值。
由 $\Delta \Phi=\Lambda \Phi$ 可以得到：
$\Delta=\Phi \Lambda \Phi^T$
把超图上的信号记为 $X=(X_1,...,X_n)$ ，表示每一个节点有一个信号值。

传统的傅里叶变换为： $F(w)=\int f(t) e^{-iwt}\, {\rm d}t$ 。这里的 $f (t)$ 表示信号， $e^{-iwt}$ 为基函数，傅里叶变换为二者的积分形式。
仿照上述傅里叶变换，离散积分就是一种内积形式，将拉普拉斯矩阵的特征向量作为傅里叶基底，
$F(\lambda_l)=\sum_{i=1}^N X_i u_l(i)$
其表示在特征值 $\lambda_l$ 的情况下， $X$ 的傅里叶变换就是与 $\lambda_l$ 对应的特征向量进行内积运算。
推广到矩阵形式则有： $\hat{X}=\Phi^T X$ ，此时特征向量为傅里叶基底，而特征值则为频率。
逆变换为： $X=\Phi\hat{X}$

超图上的卷积

卷积定理：函数卷积的傅里叶变换是函数傅里叶变换的乘积。也就是说卷积为函数傅里叶变换的乘积的逆变换；对于函数 $f (t)$ 和函数 $h (t)$ 有：
$f*h=F^{-1}[\hat{f}(w)\hat{h}(w)]=\frac{1}{2\pi}\int \hat{f}(w)\hat{h}(w) e^{iwt}\,{\rm d}w$
仿照上述定义：
卷积核 $g$ 的傅里叶变换可以写为 $\hat{g}=diag(\hat{g}(\lambda_1),...,\hat{g}(\lambda_n))$
因此两者乘积为 $\hat{g}*X=\hat{g}\Phi^TX$ ，求其逆变换为 $\Phi \hat{g}\Phi^TX$

可以将 $\hat{g}$ 变换为 $g(\Lambda)=diag(g(\lambda_1),...,g(\lambda_n))$ ，为特征值的对角矩阵
信号与滤波器的谱卷积可以表示为：
$g\star X=\Phi((\Phi^Tg)\odot(\Phi^TX)) =\Phi g(\Lambda)\Phi^TX$
由于上式计算代价很大：（1）使用特征向量矩阵的乘法运算复杂度为 $O(n^2)$ ；（2）计算规模较大的超图的拉普拉斯矩阵的特征分解需要很大的计算量。因此采用切比雪夫多项式的K阶阶段来对 $g(\Lambda)$ 进行近似。

附上一个推导讲解文章链接：Chebyshev多项式作为GCN卷积核

切比雪夫多项式：
$T_k(x) = \begin{cases} 0, & k=0\\ x, & k=1\\ 2xT_{k-1}(x)-T_{k-2}(x), & k>1 \end{cases}$
得到一个新的卷积核为
$g_\theta(\Lambda)\approx\sum^K_{k=0}\theta_kT_k(\tilde{\Lambda})$
这里的 $\tilde{\Lambda}$ 是对 $\Lambda$ 的变换，将其范围限制在 $[- 1, 1]$ 之间，得到 $\tilde{\Lambda}=2\Lambda/\lambda_{max}-I$
因此得到卷积公式如下：
$g_\theta(\Lambda)\star X\approx\Phi\sum_{k=0}^K\theta T_k(\tilde{\Lambda})\Phi^Tx=\sum_{k=0}^K\theta_kT_k(\Phi \tilde{\Lambda }\Phi^T)x=\sum^K_{k=0}\theta_kT_k(\tilde{\Delta})x$
其中 $\tilde{\Delta}=\frac{2}{\lambda_{max}}\Delta-I$ ，在上面的公式中，无需计算拉普拉斯的特征向量，只需要进行矩阵的运算。由于超图中的拉普拉斯已经能够很好地表示节点之间的高阶相关性，因此可以进一步地令 $K = 1$ ，来简化卷积运算，并令 $\lambda_{max}\approx2$ 因此得到如下公式：

在这里插入图片描述

这里的 $\theta_0$ 和 $\theta_1$ 是滤波器的参数，定义一个简单的参数来避免过拟合：
$\begin{cases} \theta_0=1/2\ \theta D^{-1/2}_vHD_e^{-1}H^TD^{-1/2}_v \\ \theta_1=-1/2\ \theta \end{cases}$
把 $W + I$ 看作一体作为超边权重，因此卷积运算最终可以转化为 $\theta D^{-1/2}_vHWD_e^{-1}H^TD^{-1/2}_vx$

如有一个超图信号X，具有 $n$ 个节点， $C_1$ 个特征维度，其卷积可以表示为：
$Y=D_v^{-1/2}HWD_e^{-1}H^TD^{-1/2}_vX\Theta$
其中 $\Theta$ 为训练过程中需要学习的参数，滤波器 $\Theta$ 在超图节点中提取特征。

一个超边卷积层：
$X^{(l+1)}=\sigma(D^{-1/2}_vHWD_e^{-1}H^TD^{-1/2}_vX^{(l)}\Theta^{(l)}$
$X^{(l+1)}$ 为第 $l$ 层的超图信号， $X^{(0)}=X$ , $\sigma$ 为激活函数。

分析

下图中说明了超图神经网络细节。数据集是多模态数据，为每一种模态构建一个超图结构，再将多个模态的超图进行串联，形成一个大超图。再将超图结构和节点特征输入HGNN进行训练，得到输出标签。
图中两个箭头，一种为多模态，一种为单一模态形式。
在这里插入图片描述
下图中，描述了一个HGNN层的卷积过程，其能够进行节点-边-节点的变换，利用超图结构更好地细化特征。

Node Feature Trasform。通过滤波器 $\Theta$ 对节点特征 $X^{(1)}$ 进行处理得到 $N\times C_2$ 的节点特征
可以将其看作是一个 $N\times C_1$ 的矩阵 $X$ 与一个大小为 $C_1\times C_2$ 的矩阵 $\Theta$ 的乘积
Edge Feature Gathering。根据超边集合节点规则，将上一步更新过的特征矩阵与 $H^T$ 相乘得到 $E\times C_2$ 的超边特征
$E\times N$ 的矩阵 $H^T$ 与一个大小为 $N\times C_2$ 的矩阵的乘积
Node Feature Aggregating。将相关超边特征进行聚合得到输出节点的（ $N\times C_2$ ）特征
$N\times E$ 的矩阵 $H^T$ 与一个大小为 $E\times C_2$ 的矩阵的乘积

实现

构建超图。将 $N$ 个对象表示为 $X=[x_1,...,x_n]^T$ 。计算两个顶点间的欧式距离，采用 $K$ 近邻算法来构建超边，每条超边中有 $K + 1$ 个顶点，获得维度为 $N\times N$ 的关联矩阵 $H$ 。
构建分类模型。
数据被分为测试集和训练集两个部分，建立两层HGNN模型（每一次进行两次卷积），使用激活函数生成预测标签。在训练过程中，采用反向传播来更新滤波器参数。对测试数据的标签进行预测，来对性能进行评估。
在处理多模态信息时，可以将各种超边进行融合

实验

引文网络分类

数据集

以上的两个数据集为图结构，每次选取图中的一个顶点作为质心，利用其连接的顶点生成超边。
隐藏层的特征维数设置为16，采用 $d r o p o u t$ （随机删除一些神经元）来避免过拟合， $\ rate=0.5$ 。
采用 $R e L U$ 作为激活函数，采用Adam优化算法来最小化损失函数， $learning\ rate=0.001$
结果。在数据集上分别运行100次，得到平均准确率。与其他方法对比如下表。由于构建的超图相比于图并没有添加额外的信息，因此其准确率提高不大。

视觉对象识别

数据集

采用两种形状表示方法，多视图卷积神经网络（MVCNN)以及群视图卷积神经网络（GVCNN)。
构造超图结构。
使用一种特征，选取10个邻居构建超边
使用两种特征，每一种特征构建一个超图，再将不同的超图进行拼接
效果良好

六九八

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
【论文阅读】Hypergraph Neural Networks

Hypergraph Neural Networks超图学习部分超图上的谱卷积超图的傅里叶变换超图上的卷积分析实现实验引文网络分类视觉对象识别超图学习部分定义超图G=(V,E,W)\mathcal{G=(V,E,}W)G=(V,E,W)，分别代表顶点、超边、权重。超图可以用关联矩阵HHH来表示：h(n,θ)={1,if v∈e0,otherwiseh(n,\theta) =\begin{cases} 1, & \text{if } v\in e\\0, & \te
复制链接

扫一扫