SRGNN 基于图神经网络的会话推荐推荐系统经典文章阅读

本文链接：https://blog.csdn.net/qq_41982015/article/details/142728850

本文主要介绍推荐系统中会话推荐经典的文章Session-based Recommendation with Graph Neural Networks，发布在2019年的AAAI上。

前置知识

会话推荐：基于当前基于用户当前会话（如浏览历史或点击序列）进行个性化推荐的技术，旨在为用户实时提供相关建议，尤其在缺乏长期用户信息的情况下表现出色。场景：匿名用户逛网站，只有一些点击信息，此时选出一些对其进行推荐，就是会话推荐。本文一个会话建模如 $v_1\rightarrow v_2\rightarrow v_4\rightarrow v_3$ ，其中v为物品，就是根据点击不同物品的顺序建模多个序列。
图神经网络：传统神经网络（CNN和RNN）应用于规则数据结构（图像或序列），图神经网络（GNN）直接处理非欧几里得的图结构数据。GNN通过递归地更新节点状态捕获节点间的关系和依赖性，通过信息传递机制从节点的局部邻域收集信息。由于GNN的节点聚合策略是基于邻居节点的消息传递，这使得它可以处理大规模图数据。
GGNN：门控图神经网络，部分文章认为SRGNN可以理解成GGNN4rec，在文中第一部分embedding的时候使用该方法进行编码。具体可参考ICLR2016的文章《Gated Graph Sequence Neural Networks》。

概述（动机与现在存在的问题）

原文概述：基于会话的推荐问题旨在基于匿名会话预测用户行为。先前的方法将会话建模为一个序列，并估计除项目表示之外的用户表示以进行推荐。虽然取得了有希望的结果，但它们不足以在会话中获得准确的用户向量，并且忽略了项目的复杂转换。为了获得准确的项目嵌入并考虑项目的复杂转换，我们提出了一种新方法，即基于图神经网络的会话推荐，简称 SR-GNN。在所提出的方法中，会话序列被建模为图结构数据。基于会话图，GNN 可以捕获项目的复杂转换，而这些转换很难通过以前的传统顺序方法揭示。然后使用注意网络将每个会话表示为该会话的全局偏好和当前兴趣的组合。在两个真实数据集上进行的大量实验表明，SR-GNN 明显优于最先进的基于会话的推荐方法。

概述中得到信息：本文侧重了item的复杂转换；本文提出新方法相较其他方法可获得更准确的embedding。现在（2019年）很多论文都是将一个会话当做一个人，具有对应的序列进行推荐，但是本文以item为单元进行图学习。

简介部分

这部分主要引出在用户身份未知的情况下进行推荐的应用场景，即会话推荐，其主要特征为匿名、长度较短、数量众多。先前的方法主要是用的为马尔科夫链、循环神经网络（与GNN区别为处理的数据是结构化的）等。

这些方法都具有局限性，比如一直存在的因为长度短很难准确估计用户表征。且先前有论文提到 item transcation比较重要，但只是对连续项目之间的单向转换进行建模，而忽略了上下文（即会话中的其他项目）之间的转换。

因此本文提出一种Session-based Recommendation with Graph Neural Networks（SR-GNN），以探索项目之间的丰富转换并生成项目的准确潜在向量。具体流程图如下所示：
SRGNN流程图
首先，将所有会话序列建模为有向会话图，其中每个会话序列可视为一个子图。然后，依次处理每个会话图，并通过门控图神经网络获得每个图中涉及的所有节点的潜在向量。之后，将每个会话表示为用户在该会话中的全局偏好和当前兴趣的组合，其中这些全局和局部会话嵌入向量均由节点的潜在向量组成。最后，对于每个会话，预测每个项目成为下一个点击的概率。

主要贡献：

将分离的会话序列建模为图结构数据，并使用图神经网络来捕获复杂的项目转换。
为了生成基于会话的推荐，本文不依赖于用户表示，而是使用会话嵌入，它可以仅基于每个单个会话中涉及的项目的潜在向量来获得。
实验证明优于当时其他方法。

提出方法

问题目标

基于会话的推荐旨在预测用户接下来会点击哪个项目，仅基于用户当前的顺序会话数据，而不访问长期偏好配置文件。公式化表述为具有 $V=\{v_1,v_2,...,v_m\}$ 这么多个item，以及一个匿名的会话序列 $s=[v_{s,1},v_{s,2},...,v_{s,n}]$ 预测 $s$ 下一次点击，即 $v_{s,n+1}$ 。在该模型下，对于会话 s，我们输出所有可能项目的概率