【综述笔记】Graph Neural Networks in Recommender Systems

最新推荐文章于 2023-04-15 01:21:46 发布

weixin_45519842

最新推荐文章于 2023-04-15 01:21:46 发布

阅读量1.6k

点赞数 4

文章标签：大数据 python 机器学习人工智能深度学习

本文链接：https://blog.csdn.net/weixin_45519842/article/details/110914413

版权

本文详细探讨了图神经网络(GNN)在推荐系统中的应用，从一般推荐和序列推荐两个方面阐述了GNN如何捕捉用户和物品的交互信息。GNN通过迭代传播在图结构中捕获高阶依赖，有效地整合社交关系和知识图谱信息，改善推荐性能。文章还提出了未来研究方向，包括高效GNN设计、多图信息融合、规模化GNN和序列图构建策略等。

摘要由CSDN通过智能技术生成

原文链接：https://arxiv.org/pdf/2011.02260.pdf

Abstract

如今推荐系统的研究非常火热，GNN也在很多领域表现优异。推荐系统主要的挑战是从历史交互(historical interactions)和边信息(side information)中学习有效的用户(user)和物品(item)表示，由于很多信息具有图结构，而且GNN擅长表示学习，所以很多工作将GNN应用到推荐系统中。

本文是「基于GNN的推荐系统」方向的综述。本文全面回顾了相关工作，提出了一个新的分类体系，并阐述了有关该领域未来发展的新观点。

1 Introduction

推荐系统中大部分信息具有图结构，例如社交关系、知识图谱、user-item交互组成的二部图(bipartite graph)、序列中的item转移图。GNN能够通过迭代传播捕捉高阶的交互，并且能够有效地整合社交关系和知识图谱等边信息(辅助信息)。

本文主要的贡献包括：1）新的分类体系；2）全面的回顾；3）未来的研究方向。

2 Overview of RS and GNN

2.1 RS

推荐系统可以划分为「一般的(general)推荐」和「序列化(sequential)推荐」。

「一般的推荐」认为用户具有静态的兴趣偏好，并根据隐式或显式反馈建模用户和物品间的匹配程度。从图的角度，user-item交互可以看做是二部图，GNN可以捕捉user-item交互，并学习user和item表示。另外，边信息也可以用来提升推荐性能，常见的策略是增加正则项或者融合边信息的表示。

「序列化推荐」捕捉item序列中的序列化模式，为用户推荐下一个感兴趣的物品。主要有基于马尔科夫链(MC)、基于RNN、基于注意力和自注意力机制的方法。随着GNN的出现，一些工作将item序列转换为图结构并用GNN捕捉其中的转移模式。

2.2 GNN

GNN可以通过节点间的消息传播(message passing)捕捉图上的依赖。GNN的主要思想是：迭代地聚合邻域信息，并整合聚集后的信息与当前节点的表示。根据是否使用谱卷积算子，GNN模型可以划分为谱方法和非谱方法。「谱方法」在傅里叶域(谱域)上定义图卷积算子，需要原始的图结构表示节点间的关系。「非谱方法」需要设计聚合器(aggregator)和更新器(updater)。聚合器用于聚合来自邻居的消息，更新器用于融合邻居节点和中心节点。下面简单介绍四种常见方法。

2.3 Why GNN for Recommendation

在推荐系统中使用GNN的动机有两点：1）RS中大多数据具有图结构；2）GNN擅长捕捉节点间的连接和图数据的表示学习。Fig1-4分别表示二部图、序列图、社交关系图和知识图。

最近，GNN相比于随机游走等传统的图学习方法取得了更好的表现。对于二部图，GNN能够迭代地从交互的items中传播信息，并更新用户向量(对item同理)，可以增强user/item表示。GNN还可以学习边信息的压缩表示，学习到的向量可以整合到交互数据的表示中以提升性能，另外的策略是结合多个图到一个异质图，然后在全图上传播信息。

3 Categories of GNN-based Recommendation

本文根据「用到的信息类型」和「是否考虑物品顺序」进行分类，如fig 5所示：

本文列出了以下有代表性的模型：

4 General Recommendation

一般的推荐利用user-item交互建模用户偏好，但是受到数据稀疏性和冷启动的制约，引入边信息可缓解以上问题。

4.1 Without side information

该视角下推荐系统的关键问题是矩阵补全。从图的角度，矩阵补全可以看做是图上的链接预测(link prediction)问题。GNN可以捕捉高阶交互，在二部图上应用GNN就是利用用户交互过的物品增强用户表示，对item同理。SVD++同样也是利用用户交互过的物品增强隐语义(latent factor)模型，所以单层GNN可以看做是SVD++的增强版本，多层GNN能够有效模拟信息扩散过程。

4.1.1 The overall framework. 主要挑战是如何传播用户交互过的物品信息给用户，如何传播用户信息给物品。GNN在二部图上的应用存在四个关键问题：