【推荐系统】RippleNet——基于知识图谱偏好传播的推荐系统

最新推荐文章于 2025-04-16 13:24:34 发布

华师数据学院·王嘉宁

最新推荐文章于 2025-04-16 13:24:34 发布

阅读量3.7k

点赞数 11

分类专栏：推荐系统论文解读 # 知识图谱的应用文章标签： RippleNet 知识图谱推荐系统

本文链接：https://blog.csdn.net/qq_36426650/article/details/108564608

版权

论文解读同时被 3 个专栏收录

104 篇文章

订阅专栏

知识图谱的应用

11 篇文章

订阅专栏

推荐系统

5 篇文章

订阅专栏

【推荐系统】RippleNet——基于知识图谱偏好传播的推荐系统

论文名称：《RippleNet: Propagating User Preferences on the Knowledge Graph for Recommender Systems》
PDF：https://arxiv.org/pdf/1803.03467
源码地址：https://github.com/hwwang55/RippleNet.

一、前言

推荐系统（Recommender System, RS）作为最经典最重要的人工智能应用，已经在诸多行业中落地应用，例如国内外电商网站（淘宝、拼多多等）上的商品推荐、视频提供方（抖音、小红书、YouTube）的视频推荐等。在推荐系统任务中，有两个主题，分别是用户（User）和物品（Item），推荐系统的目标则是在给定一个用户的条件下，从海量的候选物品中寻找前K个推荐该用户，因此推荐也是对用户个性化的过程。

二、推荐系统

现如今传统的推荐系统有协同过滤（CF）、矩阵分解（MF）、因子分解机（FM），深度学习中则将推荐演化为点击率预测（CTR）+重排序（Re-ranking）的过程。但这些传统的推荐系统方法普遍存在数据稀疏和冷启动两个问题，使得推荐效果并不如意。

数据稀疏（Data Sparsity）：例如在电商环境下，有许多商品（item）是奢侈品，或刚刚上架的新品，使得其很少有人取购买；或者对于一大部分的用户并不经常浏览商品或购买商品，使得大多数的用户或商品记录是稀疏的。在协同过滤任务中，通过构建user-item表可知，大多数的元素均为0.
冷启动（Cold Start）：如果基于物品的推荐（itemRS），通常是根据用户的行为历史记录来进行分析和推荐，但对于一些刚刚注册的新用户，其从未在该平台留下过任何行为记录，则无法根据传统的用户相似度等方法直接进行推荐，此时则称为冷启动。

现如今有诸多方法以解决稀疏性和冷启动为动机，例如引入物品描述信息、用户的信息、用户在其他平台的行为记录等作为辅助信息（Side Information）。随着知识图谱的发展，将知识图谱作为辅助信息来解决上述两个问题的方法成为推荐系统的一种思路。我们归纳为两类：

基于embedding的方法：通常将知识图谱使用表示学习方法进行嵌入，即将知识图谱中的实体和边用低维度的连续向量表示，然后基于这些向量进行推荐。一般思路是用知识图谱来表示物品或用户。
基于路径的方法：这一类通常是将用户与物品构建成一个较大的异构图，然后通过对用户到指定物品之间的路径表示进行预测。

我们知道，协同过滤的做法是通过一个用户-物品共现矩阵的行或列向量来表示用户或物品，并使用简单的相似度度量来返回TopK个结果；本文主要希望利用知识图谱来对用户历史行为记录以及潜在的偏好进行表示，因此将推荐视为两个过程，分别是点击率预测以及排序。

点击率预测（CTR） 是指给定一个用户和一个物品，通过特征工程或深度学习表征方法分别对用户和物品进行向量化，然后使用相似度方法预测点击率，通常为0-1之间的数。另外也可以认为是一个二分类问题，例如0表示负反馈，1表示正反馈。
召回+排序：通常在推荐系统中，物品的个数是成千上万的，因此不可能将每一个物品分别与当前用户进行点击率预测，因此需要先在海量的数据中进行召回，即粗略筛选形成候选项后，再一一计算点击率。最后根据数值进行排序，返回TopK个结果。

三、RippleNet

为了同时结合两者的优势，RippleNet模型被提出，其基本思想是：
（1）像真实世界里水滴滴落水面一样，向外侧以波纹形式传播。如果每一个用户的历史点击记录就像水滴一样，则其潜在的兴趣将会向外传播，这也称作偏好传播（User Preferences propagation）;
（2）如图所示，如果一个用户看过（或给与正反馈）包括“Back to the Future”、“Cast Away”和“The Green Mile”三个电影，而“Back to the Future”是由Robert导演，“Cast Away”和“The Green Mile”由Tom主演，则根据构建的知识图谱可知，Robert还导演了“Forrest Gump”，Tom也在该影片主演，所以可以推测该用户可能喜欢“Forrest Gump”电影。

在这里插入图片描述

图1 基于知识图谱的电影推荐案例

在具体了解RippleNet之前，需要先了解如何构建物品知识图谱。如下图所示，是一个电影知识图谱的样例。其中节点表示物品（Item），其可能是电影，也可能是时间，也可能是导演等。边则表示两个实体之间的语义关系，例如Forrest Gump表示电影，U.S表示国籍，两者之间的关系则是拍摄地（film.country）。因此可以使用开放领域的FreeBase，也可以根据实际使用的数据集自行构建。

在这里插入图片描述

图2 知识图谱

因此读者可能要问，如何利用知识图谱来进行推荐？ 我们给出形式化的描述：

共现矩阵。 给定一个用户集合 $\mathcal{U}=\{u_1,u_2,...\}$ ，和物品集合 $\mathcal{V}=\{v_1,v_2,...\}$ ，因此给定一个矩阵 $\mathbf{Y}=\{y_{uv}|u\in\mathcal{U},v\in\mathcal{V}\}$ ，其中当用户 $u$ 与物品 $v$ 之间存在交互信息时， $y_{uv}=1$ ，否则为 $y_{uv}=0$ 。换句话说，该矩阵为采用协同过滤方法时所构建的用户-物品共现矩阵。经验来讲，该矩阵 $\mathbf{Y}$ 是稀疏矩阵，因此推荐系统的目标则是预测那些用户与物品没有交互的部分。

Ripple集合。如何通过知识图谱来表示用户潜在的偏好？我们首先定义Ripple集合。假设给定一个共现矩阵 $\mathbf{Y}$ ，和一个用户 $u$ ，则该用户对应于共现矩阵中所有 $y_{uv}=1$ 的物品即为历史行为记录（正反馈的物品）。我们记做 $\mathcal{E}^{0}_{u}=\mathcal{V}_u=\{v|y_{uv}=1\}$ 。因此该集合 $\mathcal{E}^{0}_{u}$ 内所有的实体对应于知识图谱中记为一个种子（Seed），每个种子可作为起点并向邻近的其他实体进行传播，每次传播记为1跳，则第k跳对应的实体集合表示为

$\mathcal{E}^{k}_{u} = \{t|(h,r,t)\in\mathcal{G},h\in\mathcal{E}^{k-1}_{u}\}$

其中 $\mathcal{G}$ 表示一个知识图谱， $(h, r, t)$ 则为一个三元组，其中 $h$ ， $t$ 为头实体和尾实体， $r$ 表示二者之间的有向关系。根据这个集合，我们可以定义Ripple集合：

$\mathcal{S}^{k}_{u} = \{(h,r,t)|(h,r,t)\in\mathcal{G},h\in\mathcal{E}^{k-1}_{u}\}$

简单的来说， $\mathcal{E}^{k}_{u}$ 表示该用户 $u$ 所有历史记录对应的实体所有第k跳对应的实体的集合，而 $\mathcal{S}^{k}_{u}$ 则表示所有第k-1跳与第k跳对应的三元组。因此前面所谓的“偏好传播”则是通过集合 $\mathcal{S}^{k}_{u}$ 体现，随着k的增大而向外传播，就像水面上的波纹一样。

特殊说明的是，当 $k = 0$ 时，对应的实体 $\mathcal{E}^{k}_{u}$ 则表示用户的历史行为数据（显式正反馈的物品），而当 $k > 0$ 时，则是潜在的偏好。

实体表示。知识图谱的表示我们可以使用基于Trans系列的方法（例如TransE、TransH等），也可以使用语义匹配（Semantic Matching）方法，例如ComplEx、DisMult等。为了能够充分反映每一个实体在图中的语义关系，我们使用基于张量分解的方法。

模型架构。RippleNet的整体架构如下图所示：

在这里插入图片描述

图3 模型架构图

首先给定一个用户 $u$ ，一个物品 $v$ 的表示 $\mathbf{v}$ ，历史记录（Seed） $\mathcal{S}^{0}_{u}$ 以及构建好的知识库 $\mathcal{G}$ 。首先进行第一次传播
$(h,r)\rightarrow t$ ，即 $k : = 1$ （“ := ” 表示赋值）；
获得第 $k = 1$ 跳的的潜在偏好 $\mathcal{S}^{1}_{u}$ ，将所有对应的尾实体 $t$ 与当前的物品 $v$ 进行相似度计算后加权求和，公式为：
$\mathbf{o}_u^1 = \sum_{(h_i,r_i,t_i)\in\mathcal{S}_u^1}p_i\mathbf{t}_i$
其中 $\mathbf{h,t}$ 表示头尾实体的向量表示，权重 $p_i = softmax(\mathbf{v^{T}R}_i\mathbf{h}_i)$ 表示 $\mathcal{S}^1_{u}$
中每一个潜在的偏好物品与当前物品的相似度权重， $\mathbf{R}$ 为关系矩阵。直观的理解即为如果当前跳内的物品与目标物品 $v$
越相似，则分配权重越大，如果恰巧 $v$ 就在 $\mathcal{S}^1_{u}$ 中，则说明其越有可能被推荐。
将 $\mathbf{v^{T}R}_i\mathbf{h}_i$ 替换为 $\mathbf{o}_u^1$ ，执行与1,2相同的步骤，此时 $k : = k + 1$ 。