图注意力网络（GAT）

最新推荐文章于 2024-07-15 08:36:29 发布

kyrie变相不减速

最新推荐文章于 2024-07-15 08:36:29 发布

阅读量2.1w

点赞数 7

文章标签：网络矩阵算法

本文链接：https://blog.csdn.net/qq_45836365/article/details/122757107

版权

本文介绍了图数据结构，包括邻接矩阵和度矩阵，并详细阐述了图注意力机制，其中关注了注意力系数的计算及其在图注意力层中的应用。此外，还提及了多头注意力机制以增强模型的表现。文章总结了GAT网络的主要思想，强调了其对邻接节点处理的高效性。

摘要由CSDN通过智能技术生成

一、图数据结构知识

图是指一系列相互连接的节点，且每个节点自己也具有一定的特征。如下图所示即一个典型的图结构。在这里插入图片描述该图一共有五个结点，每个结点有自己的特征Fi.另一方面，为了描述图的结构特点，常用邻接矩阵A和度矩阵D.其中，对于一个N个结点的图来说，邻接矩阵A为一个大小为N*N的对称矩阵，若两个结点i，j直接有连接，则Aij=Aji=1，否则为0.度矩阵D大小同样，除对角线上，其余位置的值均为0，Dii的值为与结点i直接连接的结点的数目。实际处理中还存在一种常见的矩阵拉普拉斯矩阵L，L=D-A。

二、图注意力机制

图注意力网络的关键即是图注意力层，图注意力层的处理对象即为整张图的每个结点，如对于N个结点，每个结点特征维度为F的一张图，通过图注意力层得到的输出即为N*F‘，其中F’为输出层的特征维度。

用h={h1,h2,h3,…hN}表示输入数据，其中hi是大小为F的向量。h‘={h’1,h’2,…h’N}表示输出，hi’为大小为F‘的向量。论文提出了图注意力层从输入计算每个结点的输出，入上图所示，与结点3相邻的结点有2，4，因此我们仅考虑这两个结点对于结点3输出的影响。为此提出了注意力系数eij来表示结点j对于结点i的影响。（注：eji ！=eij，其表示结点j对于结点i的影响）.由此为得到h’i，我们需要考虑与结点i相邻的所有结点对于结点i的注意力系数。因此我们得到如下的关键公式：在这里插入图片描述
其中：sigmod表示一个非线性函数，Ni表示与结点i相邻的所有结点组成的域，hj表示结点j的特征向量，W为一个大小为F‘×F的权重矩阵。
再将eij的计算公式带入上式可得：
其中，LeakyReLU为非线性激活函数：y =x， x>=0 y=ax x<0
II表示将左右两个矩阵连接在一起，Whi形状为F’×1，连接后得到一个大小为2F‘×1的矩阵。a为一个大小为2F’的权重向量，因此两者相乘得到一个实数，最后得到一个数即注意力系数。