【论文解读 WWW 2019 | HAN】Heterogeneous Graph Attention Network

最新推荐文章于 2025-04-14 11:08:54 发布

byn12345

最新推荐文章于 2025-04-14 11:08:54 发布

阅读量6.4k

点赞数 8

分类专栏： NE&GNN 论文文章标签： HAN 注意力机制 WWW 异质图

本文链接：https://blog.csdn.net/byn12345/article/details/104992824

版权

论文同时被 2 个专栏收录

72 篇文章

订阅专栏

NE&GNN

36 篇文章

订阅专栏

论文题目：Heterogeneous Graph Attention Network

论文来源：WWW 2019

论文链接：https://arxiv.org/abs/1903.07293v1

代码链接：https://github.com/Jhy1993/HAN

关键词：社交网络, 神经网络, 图分析, 注意力机制(Attention)

文章目录

1 摘要
2 引言
3 定义
4 HAN模型
- 4.1 节点级别的attention
- 4.2 语义级别的attention
5 实验
6 总结

1 摘要

本文基于层级的注意力机制(hierarchical attention)提出异质的GNN模型HAN(Heterogeneous graph Attention Network)。

包括节点级别(node-level)的注意力和语义级别(semantic-level)的注意力。

节点级别的注意力是学习节点和其基于元路径的邻居之间的重要性，语义级别的注意力是学习不同元路径的重要性。

在3个真实数据集上实验效果超过state-of-the-art，并且注意力机制有很好的可解释性。

2 引言

GAT是使用了注意力机制的GNN，但只能用于同质图，不能用于异质图。本文设计了使用注意力机制并且能用于异质图的HAN模型，需要解决以下几个需求：

（1）图的异质性

不同类型的节点特性不同，它们的特征要映射到不同的特征空间。如何处理复杂的结构信息并且保留多样的特征信息是亟待解决的问题。

（2）语义级别的attention

异质图中不同的元路径显示了不同的语义信息，如何选择最有意义的元路径并且混合这些不同的语义信息是个问题。语义级别的attention就是为不同元路径衡量重要程度，分配不同的注意力。

（3）节点级别的attention

给定一种元路径，每个节点都有多个基于该元路径的邻居，如何区别这些邻居的不同之处，选择信息量最丰富的的邻居是个问题。节点级别的attention就是衡量这些邻居的重要程度，为其分配不同的注意力。

作者提出

作者提出HAN模型解决上述问题，步骤如下：

（1）将节点特征作为输入，使用特定类别的转换矩阵将不同类别的节点特征映射到同一空间中。

（2）使用节点级别的attention为特定元路径下的节点邻居分配注意力。

（3）使用语义级别的attention为不同元路径分配注意力。

（4）学习到上述两个注意力系数后，以分层的方式得到邻居和多条元路径信息的最优组合，使得学习到的节点嵌入能更好地捕捉异质图中的结构信息和丰富的语义信息。最后整个模型使用反向传播优化。

本文的贡献

是第一个基于attentino机制研究异质GNN的工作
提出HAN模型，结合了节点级别的attention和语义级别的attention，实现了同时考虑接地那和元路径的重要性。模型高效，复杂度是线性的，和基于元路径的节点对的数量成正比，可扩展到大规模的异质图。
实验证明了模型有效性，超越state-of-the-art，并且模型有很好的可解释性。

3 定义

异质图、元路径以及基于元路径的邻居的定义不再赘述。要注意的是，节点 $i$ 的基于元路径 $\Phi$ 的邻居 $N^{\Phi}_i$ 包括 $i$ 节点自身。图1是IMDB数据集组成的异质图例子。

一些符号的定义如下：

4 HAN模型

首先提出节点级别的attention以学习到基于元路径的不同邻居的权重，然后将它们聚合得到语义级别的节点嵌入。之后HAN通过语义级别的attentino区别出不同的元路径，得到针对特定任务的特定语义下节点嵌入的最优加权组合。

HAN模型的整体架构如图2所示。

4.1 节点级别的attention

（1）由于节点的异质性，不同类型的节点有不同的特征空间。要将不同类型节点的特征通过转化矩阵，映射到同一特征空间才能进行后续处理。其中，每种类型的节点对应的转换矩阵 $M_{\phi_i}$ 也是不同的。转换矩阵只基于节点类型不针对于边类型。映射过程如下所示， $h_i, h_{i^{'}}$ 分别是节点 $i$ 的原始特征和转换后的特征。