图注意力神经网络GAT 浅析，单层GAT layer 理解

最新推荐文章于 2024-05-31 19:51:37 发布

znsoft

最新推荐文章于 2024-05-31 19:51:37 发布

阅读量2.8k

点赞数

分类专栏：图神经网络文章标签：深度学习

本文链接：https://blog.csdn.net/znsoft/article/details/116354989

版权

图神经网络专栏收录该内容

12 篇文章 2 订阅

订阅专栏


class GATLayer(nn.Module):
    def __init__(self,g,in_dim,out_dim):
        super(GATLayer,self).__init__()
        self.g=g
        self.fc=nn.Linear(in_dim,out_dim,bias=False)
        self.attn_fc=nn.Linear(2*out_dim, 1, bias=False)  # alpha层，映射高维到一个单个的数。

    def edge_attention(self,edges):

        z2=torch.cat([edges.src['z'],edges.dst['z']],dim=1)
        a=self.attn_fc(z2)
        return {'e':F.leaky_relu(a)}

    def message_func(self,edges): 
        return  {'z':edges.src['z'],'e':edges.data['e']}
    
    def reduce_func(self,nodes):
        alpha = F.softmax(nodes.mailbox['e'],dim=1)
        h=torch.sum(alpha * nodes.mailbox['z'],dim=1)
        return {'h': h}
    
    def forward(self,h):
        z=self.fc(h)
        self.g.ndata['z']=z
        self.g.apply_edges(self.edge_attention)  # 调用参数中的函数来更新边的features，即用src点节和dst节点的z特征拼接后，求attention值 
        self.g.update_all(self.message_func, self.reduce_func)  #通过所有的边来发送消息并更新所有节点
        return self.g.ndata.pop('h') # 移除ndata的h数据的最后一个值并返回

图注意力神经网络中的注意力：注意力其实就是加权求和中的权重。在图结构中，注意力是指一个节点的邻居节点对它的重要性（权重大小）。在图中，一个节点的邻居对它的作用并不是平等的，而且也不是对称的。比如节点2->节点3的权重大，不代表反过来节点3->节点2的权重也大（有可能节点3对节点2并不重要）。举个例子：酵母对于面粉的作用很大，放一点进去就能发面，但是把少量面粉放酵母并没有啥作用，即面粉对酵母并没有太多的作用（权重小）。

完整的GAT分为三层： GAT layer （单层GAT), MultiHeadGATLayer, GA模型(多层MultiheadGATLayer)

如果拿CNN作为例子，对照关系就是：

GATLayer = 单个卷积核

MultiheadGATLayer = 多通道卷积

GAT模型就是CNN整个模型了，由多层的多通道卷积组成。

关于比较好的 GAT描述，请参见：向往的GAT（图注意力模型） - 知乎 (zhihu.com)

GAT的核心在于计算注意力系数，看这几行

def edge_attention(self,edges):

z2=torch.cat([edges.src['z'],edges.dst['z']],dim=1) ＃对应下面公式中的 || 运算（拼接）。
a=self.attn_fc(z2) #单层前馈神经网络，对应的就是alpha操作
return {'e':F.leaky_relu(a)}

公式如下：

alpha是一个单层神经前馈神经网络。最后 alpha 把拼接后的高维特征映射到一个实数eij上。

其中的W就是self.attn_fc函数中的权重W了（由全连接网络训练得到）。

公式2:

对应：

return {'e':F.leaky_relu(a)}

非线性函数，这里就是leaky_relu了（原始论文中使用的，据说是经验得出，并没有太多理论解释）。

到于softmax,看下面的代码：

def reduce_func(self,nodes):
alpha = F.softmax(nodes.mailbox['e'],dim=1)
h=torch.sum(alpha * nodes.mailbox['z'],dim=1)
return {'h': h}

连起来看函数 edge_attention 和 reduce_func, 就能把两个公式连起来了。

GAT中的A指的是attention, 主要就是注意力系统数，这是一个标量。核心就是算每条边的这个标量值。

上面是粗浅理解，不对的地儿请大伙儿指出。

znsoft

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
图注意力神经网络GAT 浅析，单层GAT layer 理解

class GATLayer(nn.Module): def __init__(self,g,in_dim,out_dim): super(GATLayer,self).__init__() self.g=g self.fc=nn.Linear(in_dim,out_dim,bias=False) self.attn_fc=nn.Linear(2*out_dim, 1, bias=False) # attention层 ..
复制链接

扫一扫

专栏目录