讨论了最新的框架,重点是它们的核心组件,即图嵌入模块,以及它们如何解决实际的推荐问题,如可扩展性、冷启动等。我们进一步总结了常用的基准数据集、评估指标以及开源代码。最后,我们对调查结果进行了总结,并提出了这一快速发展领域的潜在研究方向。
传统的推荐系统主要有两种体系结构:基于内容的推荐系统和基于协同过滤的推荐系统。然而,在现代社会中,越来越多的应用程序从非欧几里德域生成数据并以知识图谱KG的形式表示。
通过丰富的异构信息,RS不仅能够捕获用户项交互,而且能够捕获丰富的项/用户关系,以作出更准确的建议。值得注意的是,KG中的结点(例如人或电影)可能具有不同的邻域大小(即邻域结点的数目),并且它们之间的关系也可能变化,这使得使用KG的推荐更加具有挑战性。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PE8uR8QH-1603615417349)(D:\学习笔记\放在typora里的图片\1591879693321.png)]
##文章主要贡献:
-
新分类法:知识感知深度推荐系统的核心部件是图嵌入模块,它通常是一个GNN。GNN的每一层都包含两个基本组件:Aggregator聚合器和Updater更新器。
我们将聚合器分为三类:关系不感知聚合器、关系感知子图聚合器和关系感知注意聚合器。
我们还将更新器分为三类,即纯上下文更新器、单交互更新器和多交互更新器。
-
全面概述:提供了基于GNN的知识感知深度推荐(GNN-KADR)系统的最全面的状态概述。我们对有代表性的模型进行了详细的描述,进行了必要的比较,并讨论了它们对冷启动、可伸缩性等实际推荐问题的解决方案。
-
资源收集
-
未来方向
1.相关概念:
-
知识图谱KG:一个有向图G = (V, E),V是结点E是边。【和异构信息网络那篇里的网络架构定义一样】。为了简单起见,本文将这些实体-关系-实体三元组称为知识三元组
结点v的邻域N(v)定义为直接链接到v的结点集合,
还有结点的r-邻域:Nr(v),通过某种边关系链接到v
-
用户-项推荐:用户-项推荐问题可以表述为在图里的链路预测问题
输入:建立在历史数据基础上的KG
输出:预测的边集
2.GNN-KADR系统:核心是图嵌入模块,也就是GNN
工作流程:KG→图嵌入→得到用户嵌入和项嵌入→排名→得到推荐项
在图嵌入模块:
- 首先学习为每个图结点(包括用户和项目结点)生成一个嵌入,对从输入知识图中提取的信息进行编码。
- 接下来,对于给定的用户,排名模块根据其对应的嵌入来计算该用户与每个候选项目之间的匹配分数
- 前N个项目将链接(推荐)到此用户。
####GNN实现图嵌入:
- GNN的每一层都包含两个基本组件:Aggregato聚合器和Updater更新器。
- 对于结点v,聚合器聚合来自v的邻居的特征信息以生成上下文表示。然后,更新器利用这个上下文表示和其他输入信息来获取v的新嵌入。
- 堆叠K个不同的GNN层或重用相同的GNN层K次将GNN的接收场扩展到K跳图邻域
#####2.1聚合器
-
关系不感知聚合器:对于目标结点,一个不感知关系的聚合器旨在聚合来自我们的部分或所有相邻结点的信息,以生成上下文表示。然而,在这个过程中,目标结点u与任意相邻结点v的关系r被忽略,因此它的信息没有被编码在上下文表示nu中。
- Fan等人指出现有的工业意图推荐方法依赖于大量的人工特征工程,不能充分利用用户与项目之间丰富的交互,限制了模型的性能。为了解决这些问题,他们将复杂对象(即具有属性的用户和项)以及它们之间的交互建模为一个知识图,并提出了一个名为MEIRec的框架来学习用于推荐的对象嵌入。目标结点u的上下文表示为:[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AB6X2q45-1603615417352)(D:\学习笔记\放在typora里的图片\1591834757495.png)],其中zv是v的嵌入,g是一个聚合函数,可以是平均值、LSTM或CNN,具体取决于上下文。例如,如果u是一个项目结点,那么他们选择的是平均功能,因为在点击/购买项目的用户中通常没有优先级。另一方面,他们选择LSTM作为用户结点的g,因为用户通常单击带有时间戳的项,其邻域可以被视为序列数据。