GNN+Transformer=全局与局部完美融合！

最新推荐文章于 2025-03-27 11:13:46 发布

程序猿李巡天

最新推荐文章于 2025-03-27 11:13:46 发布

阅读量1.5k

点赞数 46

文章标签： transformer 深度学习人工智能 neo4j 知识图谱机器人学习

本文链接：https://blog.csdn.net/m0_59235945/article/details/146112865

版权

2025深度学习发论文&模型涨点之——GNN+Transformer

图神经网络（GNN）和Transformer的结合是近年来的研究热点。这种结合不仅能够让两者发挥各自的优势，还能推动模型的创新，提高处理图数据的效率和性能。具体来说，通过利用Transformer，可以扩展GNN的感受野，包括那些距离中心节点较远的相关节点。相对地，GNN也可以帮助Transformer捕捉复杂的图拓扑信息，并从相邻区域高效地聚合相关节点。

除了推荐系统和图表示学习，GNN+Transformer还可以在其他领域进行更广泛的应用探索，如生物信息学、社交网络分析、知识图谱等。研究如何将GNN+Transformer的模型应用于这些领域，解决实际问题，具有重要的研究价值和应用前景。

论文精选

论文1：

[ICLR] Graph Neural Networks with Learnable Structural and Positional Representations

具有可学习结构和位置表示的图神经网络

方法

LSPE架构：提出了一种新颖的通用架构LSPE（Learnable Structural and Positional Encodings），将结构和位置表示解耦，使网络能够同时学习这两种基本属性。

随机游走位置编码（RWPE）：引入基于随机游走扩散过程的位置编码方案RWPE，用于初始化节点的位置表示。

拉普拉斯位置编码（LapPE）：考虑拉普拉斯特征向量作为位置编码，为节点提供唯一表示，但存在符号歧义问题。

位置编码损失：定义了位置编码损失函数，以约束位置编码形成受图拓扑约束的坐标系。

创新点

性能提升：在分子数据集上，使用可学习的位置编码（PE）时，性能提升显著，最高可达64.14%。

稀疏与全连接GNNs的比较：稀疏GNNs在性能上优于全连接GNNs，表明在图结构数据上，局部信息更为关键。

位置编码的解耦：通过解耦位置和结构表示，模型能够更有效地学习图中的位置信息，从而提高了图神经网络的表达能力。

RWPE的有效性：RWPE在多个数据集上优于LapPE，表明其在提供唯一节点表示方面更为有效，且不需要学习额外的符号不变性。

论文2：

[NIPS] Classic GNNs are Strong Baselines Reassessing GNNs for Node Classification

经典GNN是强大的基线：重新评估GNN在节点分类中的表现

方法

经典GNN模型：重新评估了三种经典GNN模型（GCN、GAT和GraphSAGE）在节点分类任务中的性能。

超参数调整：对GNN模型的关键超参数进行了细致的调整，包括归一化、dropout、残差连接和网络深度。

数据集多样性：在18个真实世界的数据集上进行了实验，涵盖了同质图、异质图和大规模图。

消融研究：通过消融研究，分析了不同GNN配置对节点分类性能的影响。

创新点

性能挑战：经过超参数调整后，经典GNN模型在17个数据集上取得了最佳性能，挑战了图变换器（GTs）在节点分类任务中的优越性。

超参数的重要性：揭示了超参数配置对GNN性能的显著影响，特别是在大规模图和异质图上。

归一化的必要性：在大规模图上，归一化对于稳定训练过程和提高性能至关重要。

残差连接的作用：残差连接在异质图上显著提高了性能，尤其是在需要深层网络来捕捉复杂结构时。

论文3：

[NIPS] Geometric Transformer with Interatomic Positional Encoding

具有原子间位置编码的几何Transformer

方法

Interatomic Positional Encoding (IPE)：设计了基于原子簇扩展（ACE）理论的原子间位置编码，将原子环境参数化为Transformer的位置编码。

Geometric Transformer（Geoformer）：提出了Geoformer，这是一种新颖的几何Transformer，通过IPE有效建模分子结构，用于多种分子属性预测。

原子簇扩展（ACE）理论：利用ACE理论定义了描述中心原子环境的完整基函数集，并显著减少了体阶计算的时间复杂度。

位置编码的更新与原子特征结合：在Geoformer的每个注意力块中，位置编码C⌘通过原子特征X进行更新，增强了模型对分子结构的建模能力。

创新点

Interatomic Positional Encoding (IPE)：为Transformer引入了一种新的位置编码方法，能够参数化原子环境，使模型能够学习到超越成对距离的复杂几何信息。

Geometric Transformer（Geoformer）：通过结合IPE，Geoformer在QM9数据集上的多个属性预测中超越了现有的最先进算法（SoTA），在Molecule3D数据集上无论是随机分割还是骨架分割，都实现了最低的平均绝对误差（MAE）。

性能提升：具体来说，在QM9数据集上，Geoformer在8种属性预测中取得了最佳性能，并在其余属性上表现出可比的结果。在Molecule3D数据集上，与ComENet相比，Geoformer在随机分割测试MAE上降低了32.56%，在骨架分割测试MAE上降低了3.98%。

论文4：

[ICLR] NODE FEATURE EXTRACTION BY SELF-SUPERVISED MULTI-SCALE NEIGHBORHOOD PREDICTION

通过自监督多尺度邻域预测的节点特征提取

方法

Graph Information Aided Node feature exTraction (GIANT)框架：提出了GIANT框架，利用图信息辅助的节点特征提取，通过自监督学习从原始数据中生成数值节点特征。

eXtreme Multi-label Classiﬁcation (XMC)形式化：采用了XMC形式化，这对于基于图信息微调语言模型至关重要，并且能够扩展到大型数据集。

XR-Transformers：将XR-Transformers集成到GIANT框架中，这是一种强大的解决XMC问题的方法，用于执行邻域预测任务。

理论分析：提供了理论分析，证明了使用XMC优于链接预测，并且证明了将XR-Transformers集成到GIANT框架中的合理性。

创新点

GIANT框架：解决了标准GNN流程中图无关特征提取的问题，通过图结构自监督提取数值节点特征。

邻域预测与XMC问题的联系：建立了邻域预测与XMC问题之间的联系，允许通过XR-Transformers执行邻域预测，特别是在处理大规模问题时。

性能提升：在Open Graph Benchmark数据集上的实验结果表明，GIANT在多个下游任务中显著提高了GNN的性能。例如，在ogbn-papers100M数据集上，GIANT将排名第一的方法GAMLP的准确率从68.25%提高到69.67%，SGC从63.29%提高到66.10%，MLP从47.24%提高到61.10%。

理论支持：通过理论分析，验证了XR-Transformers的关键组件在邻域预测任务中的优势，进一步加深了对XR-Transformers和XMC问题的理解。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述