图推荐系统综述：A Survey of Graph Neural Networks for Recommender System

最新推荐文章于 2025-02-13 17:19:28 发布

kaiyuan_sjtu

最新推荐文章于 2025-02-13 17:19:28 发布

阅读量1.9k

点赞数 29

本文链接：https://blog.csdn.net/Kaiyuan_sjtu/article/details/138388579

版权

作者 | twilly（已授权）

整理 | NewBeeNLP

https://zhuanlan.zhihu.com/p/686458569

第一次整理综述，作为深入这个方向的开始。应该不如AI整理的详细全面，不过这一篇文章主要是阅读时整理的一些对我来说有帮助的点，供自己未来存档回顾细节。

这篇作者对论文具体的架构以及特殊设计都写得很清楚，所以在「现有研究方法概览」部分，我主要写了现有研究方法的思路概述，算是对综述的一个小综述吧，可以供初入这个方向的uum没有太大压力的把这一篇综述读完～

我的背景是GNN比较熟，但推荐系统暂时还没太熟，所以涉及GNN的细节基本略过了。有疑问的可以评论区留言交流，后面也会慢慢补坑把基础知识部分整理出来文章一起学习。

整理不易，希望大家和未来的我读的开心～

基本信息

论文题目：A Survey of Graph Neural Networks for Recommender Systems: Challenges, Methods, and Directions

期刊信息：ACM, 2023

作者机构：

Beijing National Research Center for Information Science and Technology (BNRist),
Department of Electronic Engineering,
Tsinghua University,
School of Information Science and Technology,
University of Science and Technology of China,
Department of Electronic Engineering, Tsinghua University, China

核心思想一览

本文对于推荐系统和图神经网络的发展进行介绍与分析，并从现有工作的几大方面对最近的工作进行了总结与分类，最后对于一些开放性问题展开了讨论。

其中，本文的分类如下：

不同推荐阶段(Stage)：matching、ranking、re-ranking
不同推荐场景(Scenario)：社交推荐、序列推荐、会话推荐、捆绑推荐、跨域推荐、多行为推荐…
不同推荐目标(Objective)：准确率、多样性、可解释性、公平性…
具体应用(Application)：产品推荐、兴趣点推荐、新闻推荐、电影推荐…

下面主要将分三大部分进行整理，分别是推荐系统部分、图神经网络部分以及已有研究整理。

推荐系统部分

图神经网络部分

在本文中，主要关注图的构造、网络架构的设计以及最终的优化目标选择。

图的构建部分

在整个网络设计中，所使用的图基本上包括同构图（Homogeneous graph）、异构图（heterogeneous graph）和超图（hypergraph）。其中，异构图是有多种节点和边类型的普通图，超图是每条边可以与三个及以上的节点相连。由于超边的存在，可以把完整的交互信息用来构造超图。而在通常意义上，往往需要从实际场景抽象出来合适的点边关系。

网络架构设计部分

本文对于架构的设计是从空域和谱域来说的。其中，空域就是大家都熟悉的聚合邻居信息的思想直接处理局部数据，而谱域则是将图信号通过傅立叶卷机转化到谱域，通过图滤波过滤掉噪声数据，再通过傅立叶逆变换转换成图信号。

在这一部分，作者介绍了几个经典的GNN模型，包括GCN、GraphSAGE、GAT，还有几个不是特别基础的模型，包括HetGNN、HGNN。其中，HetGNN是异构图上的空域GNN，将邻居节点按照类型进行分类再聚合；而HGNN是超图上的谱域GNN，其传播过程为从节点线传播到超边，再由超边传递到相邻节点。

（不过这里我觉得这种分类有一点不太合理，因为通常意义上的GCN其实也是可以从谱域观点推导出来的）

由于我对于异构图和超图上的GNN架构并不熟悉，所以这里就不过多介绍。也给自己埋个坑，整理到这部分了就系统学一下。

模型优化目标

推荐系统的学习任务本质上还是一种表示学习。模型最终得到的embedding还是需要通过处理转到特定下游任务上。根据任务，可以分成分类任务、预测任务和回归任务；而根据研究对象的不同，可以分成节点任务，边任务和子图任务。

GNN应用到推荐系统中的机遇与挑战

基于GNN的推荐系统为什么成功？

GNN充分利用了结构化数据
利用了高阶连通性：通过利用高阶信息可以自然产生显式的协同过滤效果
监督信号：GNN可以把一些相关信息纳入到学习过程中。同时，GNN还包含一些自监督信息（之前一篇论文中有提到，邻域聚合的过程实际上就是一种自监督目标，直观上说，就是这样的设计暗含着让相邻节点学习到相近的节点表示）

GNN应用到推荐系统中的挑战

一是图的构建阶段。

在这一阶段，主要的任务就是把结构化数据转化成图数据，还有把传统的推荐任务变成图数据。

在构造图的时候，需要考虑以下问题：

对于节点，是否需要区分不同类型的节点，例如user/item？当输入特征为连续值的时候应该怎么处理？
对于连边，边的定义是什么？边的设计会让图中的边稠密还是稀疏？过密和过稀的边设计都不好。

二是网络的设计。在这一步需要仔细地考虑信息聚合的方式，包括信息聚合路径的选择、聚合函数的选择等等。此外，层数、架构等信息也是需要反复调整确认的。

三是模型优化目标。这里需要将传统推荐系统中的loss function转成图学习下的loss function。由于图结构、图数目的不同，这里的设计也会有很大的差别。此外，还需要考虑图结构的采样方式。这也会是一些模型优化的主要部分。

四是计算效率。推荐系统的应用场景很实际，过于复杂的模型并不具有太大的使用价值。所以需要考虑到计算效率。

现有研究方法预览

下面三张表分别是从不同的推荐阶段、推荐场景下的论文分类以及不同推荐目标下的论文分类：

从不同的推荐阶段出发

Matching阶段

关注核心：

模型的效率很关键，在匹配阶段基本都只采用粗粒度的交互关系而非细致的特征。
如何抽取协同过滤（CF）信息是一大挑战。一般这一阶段的模型都会对于CF进行额外的设计。

主要设计方向：

这里的模型架构基本都是user-item二分图，而主要目标可以分成以下两种：

提高模型精度
提升模型效率

一些采样技术使得GNN得以在大型网络上得以应用，其中还有一些是对非线性模块进行删减，这在部分数据集上可以提升性能。

相关论文细节：

Ranking阶段

关注核心：

如何设计合理的架构来捕获特征之间的交互关系？

主要设计方向：

encoder+predictor。其中，encoder部分利用特殊的图结构实现特征交互，从而得到高质量的特征表示；而predictor部分是学习到一个好的特征整合方式来实现交互。

整体来说，这一部分还是主要为了得到好的特征表示，但性能还是局限在了特征表示组件上。后期还要把更高阶的图结构信息考虑在内。

相关论文细节：

Re-ranking阶段

关注核心：

需要考虑不同item之间的相似性、互补性等交互信息->可以由GNN完成
需要考虑不同users的不同偏好->主要难点

主要设计方向：
这一部分作者只介绍了一篇论文，其利用异构图来融合项目关系图和user-item得分图，再进行信息传播。不过这一部分对于其他优化目标所做的研究还是太少。

从不同的推荐场景出发

社交推荐场景

关注核心：

怎么把社交关系放入GNN的建模中？
怎么把社交关系与用户的个人偏好结合起来？

主要设计方向：

针对问题1，从图的构造角度，会发现用户的喜好会受到高阶邻居的影响。若将这种社交影响考虑在内的话，我们在简单图中可以通过multi-layer的方式来实现；利用超图，也可以直接对于高阶社会关系进行建模。而对于数据中比较复杂的那些数据特征，可以通过构造异构图的方式，例如增加时间信息、不同角色的视角信息等方法来将多元信息整合起来。
而从信息传递的角度，这里主要会涉及到两种信息传递机制：GCN&GAT。在GCN的角度，可以改变信息传递路径or聚合函数；在GAT的角度，可以进一步认为不同邻居的社交影响是不同的。

针对问题2，涉及到的论文可以分成两个角度，一是分别从社交网络和user-item图中学习用户表示，再通过多种方法整合成为单一表示；二是直接聚合两个图的信息（比如使用GAT）再生成统一表示。

发展脉络：