2021-9月第三周周报

最新推荐文章于 2024-08-13 18:29:56 发布

weeekly

最新推荐文章于 2024-08-13 18:29:56 发布

阅读量213

点赞数

分类专栏：周报文章标签： python

本文链接：https://blog.csdn.net/qq_35368303/article/details/120336435

版权

周报专栏收录该内容

1 篇文章 0 订阅

订阅专栏

摘要

本周主要对自己的想法进行代码实现，考虑图注意力机制，对多标签数据集进行分类。

一、什么是图注意力机制？

之前讲过关于ML-GCN的一篇论文，理解了图卷积网络。该论文是将CNN用于特征提取，GCN用于标签嵌入后不断学习一个分类器。最终分类器乘以提取的特征得到分类结果。
GCN的原理是每个节点与其邻居进行加权和传入下一层，成为该节点的下一层数据。每个邻居的权重是一样的。

GAT网络与GCN的区别就是，邻居的权重是不一样的。
在这里插入图片描述
$h$ 表示输入样本， $i, j$ 分别表示不同的样本， $j$ 还表示是 $i$ 的邻居节点与 $W$ 相乘之后，表示将样本进行降维， $a$ 表示注意系数。
$e_{i j}=a\left(\mathbf{W} \vec{h}_{i}, \mathbf{W} \vec{h}_{j}\right)$
$\alpha$ 表示注意力系数，通过 $s o f t m a x$ 函数计算权重。
$\alpha_{i j}=\operatorname{softmax}_{j}\left(e_{i j}\right)=\frac{\exp \left(e_{i j}\right)}{\sum_{k \in \mathcal{N}_{i}} \exp \left(e_{i k}\right)}$
可以表示成下面的式子：
$\alpha_{i j}=\frac{\exp \left(\operatorname{LeakyReLU}\left(\overrightarrow{\mathbf{a}}^{T}\left[\mathbf{W} \vec{h}_{i} \| \mathbf{W} \vec{h}_{j}\right]\right)\right)}{\sum_{k \in \mathcal{N}_{i}} \exp \left(\operatorname{LeakyReLU}\left(\overrightarrow{\mathbf{a}}^{T}\left[\mathbf{W} \vec{h}_{i} \| \mathbf{W} \vec{h}_{k}\right]\right)\right)}$
将上一步得到的权重系数与降维后的邻居相乘求和，用 $\sigma$ 表示激活函数
$\vec{h}_{i}^{\prime}=\sigma\left(\sum_{j \in \mathcal{N}_{i}} \alpha_{i j} \mathbf{W} \vec{h}_{j}\right)$
根据上式可以得到新的节点值。然后根据更新后的节点值可以进行多标签分类。