【PC-Conv】提出一种新的机制,能够在不同同配性水平的图上同时提取同配性和异配性信息。
发表在2024年AAAI会议上,作者是中国电子科技大学的,引用量4,开源代码可以复现。
AAAI会议简介:由人工智能促进协会AAAI(Association for the Advancement of Artificial Intelligence)主办,人工智能顶会,CCF A。
查询会议:
- 会伴:https://www.myhuiban.com/
- CCF deadline:https://ccfddl.github.io/
原文和开源代码链接:
- paper原文:https://ojs.aaai.org/index.php/AAAI/article/view/29246
- 开源代码:https://github.com/uestclbh/PC-Conv
0、核心内容
- 问题背景:现有的图表示学习方法在处理具有强同配性或强异配性的图上取得了不错的效果,但无法很好地泛化到现实世界中同配性和异配性不同程度混合的图上。
- 研究目标:提出一种新的机制,能够在不同同配性水平的图上同时提取同配性和异配性信息。
- 方法介绍:
- 提出了一种两重过滤机制,用于在异配图中提取同配信息,反之亦然。
- 扩展了图热方程,用于执行异配性全局信息的聚合。
- 利用Possion-Charlier(PC)多项式来近似得到的滤波器。
- PC-Conv架构:提出了一种强大的图卷积PC-Conv,以及其实例化PCNet,用于节点分类任务。PC-Conv能够利用多阶信息,并具有可学习的参数。
- 性能对比&实验验证:与现有的GNNs相比,PCNet在同配图和异配图上都展现出了竞争性的性能。通过在多个数据集上进行实验,证明了PCNet在节点分类任务上达到了最先进的性能。
The main contributions of this paper are summarized as follows:
- Two-fold filtering mechanism: We develop a filering strategy to perform both homophilic and heterophilic aggregation in any graph with different levels of homophily.
- Heterophilic graph heat kernel: We extend the graph heat kernel to heterophilic graph and integrate it with a low-pass filter to form a novel PC-filter.
- PC-Conv: We propose PC-Conv to explore multi-order information with learnable parameters. An exhaustive spectral analysis is also presented.
- PCNet: We instantiate PC-Conv with a simple GNN architecture, that is, PCNet. Experiments on node classification demonstrate the state-of-the-art (SOTA) performance.
1、先验知识
① 什么是异配图热核(heterophilic graph heat kernel)?
异配图热核是一种用于处理异配图数据的新型图卷积机制。异配图是指图中连接的节点倾向于具有不同的标签或特征,与同配图相对,后者指图中相似节点更可能相互连接。
heterophilic graph heat kernel的关键特点:
- 全局信息聚合:该机制利用图热方程(graph heat equation)来聚合全局信息,特别是针对那些在局部邻域内可能缺乏足够同质性信息的异配性节点。
- 扩展图热方程:作者将传统的图热方程扩展到异配图上,通过这种方式,可以捕捉到更远距离的节点信息,从而为异配性节点提供更丰富的结构信息。
- 利用互补图:为了处理异配性节点的全局信息聚合问题,作者提出了使用互补图(complementary graph)的概念。互补图通过调整节点的自环信息,可以提供缺失的一半结构信息,有助于缓解不同类别节点间的信息聚合问题。
- 信息扩展公式:通过泰勒展开,作者将异配图的信息扩散过程表达为一个级数,这个级数考虑了奇阶和偶阶邻居的不同处理方式,以符合异配图的结构特性。
- 灵活的邻居聚合:与固定邻居大小的方法不同,异配图热核可以利用无限阶的邻居信息,并且随着阶数的增加而逐渐衰减,这提供了比传统方法更高的灵活性。
- PC-Conv的组成部分:heterophilic graph heat kernel是PC-Conv架构中的一个关键组成部分,它使得PC-Conv能够更好地处理异配图,并在节点分类任务重取得更好的性能。
heterophilic graph heat kernel是论文中提出的一种新颖的图卷积方法,它通过扩展图热方程来聚合异配图中的全局信息,从而提高了图神经网络在处理具有不同标签或特征的节点时的性能。
② 什么是图热方程(graph heat equation)?
**图热方程(Graph Heat Equation)是图论和偏微分方程领域中的一个概念,它用于描述图上节点特征随时间的扩散过程。**这个方程通常用来模拟热如何在物理空间中传播,但在这里被用作一个数学工具来分析图结构上的动态过程。
在图热方程的背景下,图被视为一个离散的空间,节点代表空间中的点,而边代表点之间的连接。图热方程的一般形式可以写作:
d x ( t ) d t = − L x ( t ) \frac{d\mathbf{x}(t)}{dt} = -L \mathbf{x}(t) dtdx(t)=−Lx(t)
其中:
- x ( t ) \mathbf{x}(t) x(t)是一个向量,表示在时间 t t t时图中所有节点的特征(或状态)。
- L L L是图的拉普拉斯矩阵(Laplacian matrix),它是一个与图的结构相关的矩阵,定义为 L =