图注意力神经网络的pytorch代码解析

最新推荐文章于 2025-01-03 19:00:55 发布

掉发的蒲公英

最新推荐文章于 2025-01-03 19:00:55 发布

阅读量5.2k

点赞数 11

分类专栏：图神经网络文章标签：神经网络机器学习数据挖掘

本文链接：https://blog.csdn.net/weixin_44240421/article/details/118451775

版权

本文详细介绍了图注意力神经网络（GAT）的基本原理，包括注意力机制的公式和多头注意力的应用。接着，对GAT的PyTorch实现进行了深入解析，从数据加载、模型搭建、模型训练到模型测试的全过程。GAT模型通过注意力机制实现了节点特征的加权融合，多头注意力则增强了模型的表达能力。在训练过程中，使用了Adam优化器和交叉熵损失函数，同时进行了训练集和验证集的性能评估。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.图注意力神经网络的原理简介

图注意网络的原理介绍有很多，可以参考知乎文章：向往的GAT（图注意力模型）。作者是清华大学的一个博士，他写的图卷积原理非常透彻，这里对于图注意力的描述也很好。

为了让后面的代码介绍更清楚，本文再重述一下注意力公式和多头注意力的原理。

1.1 注意力机制的公式

（1）计算注意力系数（attention coefficient）
对于顶点 $i$ ，逐个计算它的邻居们（ $j\in{N_i}$ ）和它自己之间的相似系数：
$e_{ij}=a([Wh_i||Wh_j]),j\in{N_i}$
$h_i$ 与 $h_j$ 分别为中心节点及其邻居节点的特征。 $W$ 的作用在于对特征进行映射，提高特征的表达能力， $[* ∣ ∣ *]$ 表示拼接，将映射之后的特征进行组合，并通过 $a (*)$ 映射成一个实数，作者通过单层前馈神经网络实现。然后通过类似于softmax的方法求解注意力系数：
$\alpha_{ij}=\frac{exp(LeakyReLU(e_{ij}))}{\sum_{k\in{N_i}}exp(LeakyReLU(e_{ik}))}$