【图神经网络】使用DGL入门异构图神经网络

最新推荐文章于 2025-03-06 10:38:04 发布

镰刀韭菜

最新推荐文章于 2025-03-06 10:38:04 发布

阅读量3.4k

点赞数

分类专栏： # Deep Graph Library 文章标签： DGL 异构图异构图嵌入学习图神经网络

本文链接：https://blog.csdn.net/ARPOSPF/article/details/127995646

版权

Deep Graph Library 专栏收录该内容

4 篇文章

订阅专栏

本文介绍了异构图的概念，它允许不同类型的节点和边，广泛应用于推荐系统、学术网络和知识图谱。重点讨论了两种针对异构图的图神经网络模型——RGCN和GCMC，并展示了DGL库中异构图神经网络的实现。RGCN基于消息传递，适合节点分类和链接预测；GCMC则在产品推荐中应用，利用多关系累和函数更新节点表示。此外，还提到了DGL-KE，一个用于知识图谱嵌入的工具。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

什么是异构图？

传统同构图（Homogeneous Graph）数据中只存在一种节点和边，因此在构建图神经网络时所有节点共享同样的模型参数并且拥有同样维度的特征空间。而异构图（Heterogeneous Graph）中可以存在不只一种节点和边，因此允许不同类型的节点拥有不同维度的特征或属性。

这一特点使得异构图的应用十分广泛。事实上，如果用图来描述我们和周围事物的关系就会发现所产生的图都是天然异构的。比如今天看了电影《流浪地球》，那“我”作为观众和电影《流浪地球》之间就建立了“看了”这一关系。异构图可以用来描述这种交互关系的集合。这个图分“观众”和“电影”两类节点，以及“看了”这一类边。“我”作为观众，和电影所具有的属性一定是不同的，需要用不同的模型或者不同的特征维度来表达。这张图就天然具有了异构性。

再比如我去豆瓣上给《流浪地球》评了8分，那“我”和《流浪地球》之间就又建立了“评分”这一关系。“评分”和“看了”的属性也一定是不同的，如前者包含评分分数，后者则包含票价等。

因此，很多用于机器学习的数据都可以用异构图来建模，而需要解决的任务也可以通过学习图上的点和边，或是整张图的表示来解决。这里举几个例子。

异构图的常见建模场景

学术网络

学术网络的图结构更复杂一些。它可以包含“论文”、“作者”、“会议”和“机构”等节点类型。每个作者会隶属于某些机构，发表某些论文，而每篇论文又会被发表在某个会议上，也会引用其它的论文。每个节点同样可以有自己的特征——如论文可以用摘要当作特征等。同样，这些关系可以表示成一张异构图（图2）。

图2：学术网络

同样，链接预测和节点分类问题也适用于学术网络中。例如预测某个作者的研究领域或所属的研究团队、一篇论文或者一个作者的影响力等等。

知识图谱

知识图谱由于包含不同种类的节点和边，是一张天然的异构图。如下图，“人物”、“职业”和“荣誉”等都可以作为节点类型，而节点之间的关系也有“就职”、“获得荣誉”等多种类别。

图3：Wikidata知识图谱示例

图嵌入学习在知识图谱上也是一个很重要的任务。它的目标是对每一个节点和每一类关系学习一个高维向量表示。此外，知识图谱补全、基于知识图谱的推理以及将知识图谱与其他系统结合（比如推荐系统）等也是重要的任务。

针对异构图的图神经网络有哪些？

针对异构图设计图神经网络还是个非常新的方向。虽然论文不多，但已经在一些场景中取得了很不错的效果。这里简单介绍两个模型。

Relational Graph Convolutional Network (RGCN)

文章链接：https://arxiv.org/abs/1703.06103

Schlichtkrull, M., Kipf, T.N., Bloem, P., van den Berg, R., Titov, I., Welling, M. (2018). Modeling Relational Data with Graph Convolutional Networks. In: , et al. The Semantic Web. ESWC 2018. Lecture Notes in Computer Science(), vol 10843. Springer, Cham. https://doi.org/10.1007/978-3-319-93417-4_38

RGCN是一个在异构图上学习节点表示的早期工作（2017年）。与Graph Convolutional Network（GCN）类似，它仍然基于消息传递（Message Passing）。但与GCN不同，每条边上的消息通过每类边独有的线性变换得到。
$h_i^{(l+1)}=\sigma (\sum_{r=1}^R\sum_{j\in \mathcal{N}_{i,r}} \frac{1}{c_{i,r}}W_r^{(l)}h_j^{(l)}+W_0^{(l)}h_i^{(l)})$
RGCN可以用于节点分类和链接预测等任务。

Graph Convolutional Matrix Completion (GCMC)

文章链接：https://arxiv.org/abs/1706.02263
GCMC是在异构图上做产品推荐任务的一个尝试。它在一个由观众和电影组成的二分图上训练。观众和电影有各自的特征，而且每一条边上有对应的观众对电影的评分。GCMC将每一种评分视为一类边。

图构建完成后，每个节点通过消息传递的形式，汇总从自己邻居传递来的消息，去更新自己的表示。与RGCN不同的是，GCMC只进行一层消息传递：
$h_i=\sigma [accum(\sum_{j\in N_{i,1}}\mu_{j\rightarrow i,1},...,\sum_{j\in N_{i,R}}\mu_{j\rightarrow i,R})]$
消息同样是由源节点的原表示通过线性变换得到。与RGCN类似，每类边都有自己线性变换的参数矩阵。不同之处在于多关系累和函数accum有各种灵活选择。
$\mu_{j\rightarrow i,r}=\frac{1}{c_{ij}}W_rx_j$
GCMC算出两类点的最终表示之后，再通过softmax得出某个交互下每种评分的概率：
$u_i=\sigma (Wh_i)$
$v_j=\sigma(Wh_j)$
$p(M_{ij}=r)=\frac{exp(u_i^TQ_rv_j)}{\sum_{s\in R }exp(u_i^TQ_sv_j)}$
除了以上模型外，还有诸如Heterogeneous Graph Attention Network (HAN)，Knowledge Graph Convolution Networks for Recommender Systems (KGCN) 等关于异构图的好工作。此外，在网络嵌入（network embedding）方向还有如metapath2vec等经典的工作。

Heterogeneous Graph Attention Network (WWW’19)
Knowledge Graph Convolution Networks for Recommender Systems (WWW’19)
HetGNN: Heterogeneous Graph Neural Network (KDD’19)
Metapath-guided Heterogeneous Graph Neural Network for Intent Recommendation (KDD’19)
KGAT: Knowledge Graph Attention Network for Recommendation (KDD’19)
metapath2vec: Scalable Representation Learning for Heterogeneous Networks (KDD’17)