《推荐系统实践》算法纯享（附代码链接）（五）—— 借助上下文信息推荐篇

最新推荐文章于 2024-06-11 16:18:26 发布

MagicBubble

最新推荐文章于 2024-06-11 16:18:26 发布

阅读量3.3k

点赞数 4

分类专栏：推荐系统文章标签：推荐系统时间上下文地点上下文上下文推荐

本文链接：https://blog.csdn.net/magical_bubble/article/details/88558989

版权

推荐系统专栏收录该内容

7 篇文章 46 订阅

订阅专栏

在上一篇博客里面分享的是《推荐系统实践》中UGC相关的推荐算法，对此还不熟悉的读者可以戳这里。

关于这个系列会分为如下几个部分：

完整代码链接：https://github.com/Magic-Bubble/RecommendSystemPractice

下面将开始本系列的第五部分——借助上下文信息推荐篇。

文章目录

5 上下文推荐

5 上下文推荐

上下文的信息一般有时间、地点等。

5.1 时间上下文推荐

代码链接：https://github.com/Magic-Bubble/RecommendSystemPractice/blob/master/Chapter5/基于时间上下文信息的推荐.ipynb

带有时间的用户行为数据集一般由(u, i, t)三元组组成，表示用户u给物品i在时间t由交互的行为。

那么有如下几种方法基于带时间信息的行为进行推荐：

5.1.1 最近最热门

这是一种带时间衰减的非个性化方法。给定时间T，物品i最近的流行度 $n_i(T)$ 可以定义为：

$n_i(T) = \sum_{(u, i, t)\in Train, t<T} \frac{1}{1+\alpha(T-t)}$

其中 $\alpha$ 是时间衰减系数。

5.1.2 时间上下文相关的ItemCF算法

前面介绍的ItemCF的算法，主要包含下面两步比较重要的阶段：

利用用户行为离线计算物品之间的相似度
根据用户的历史行为和物品相似度矩阵，给用户做个性化推荐

这两步其实都可以加入时间信息。首先回顾不加时间信息的ItemCF算法计算物品相似度的公式：

$j)=\frac{\sum_{u\in{N(i) \bigcap N(j)}}1}{\sqrt{|N(i)||N(j)|}}$

而在给用户u做推荐时，用户u对物品i的兴趣 $p (u, i)$ 通过如下公式计算：

$p(u,i)=\sum_{j\in N(u)} sim(i, j)$

在得到时间信息之后，就可以用如下公式改进相似度计算：

$j)=\frac{\sum_{u\in{N(i) \bigcap N(j)}} f(|t_{ui}-t_{uj}|)}{\sqrt{|N(i)||N(j)|}}$

这个式子中引入了和时间相关的衰减项 $f(|t_{ui}-t_{uj}|)$ ，其中 $t_{ui}$ 是用户u对物品i产生行为的时间。 $f$ 函数的含义是，用户对物品i和物品j产生行为的时间越远，则 $f(|t_{ui}-t_{uj}|)$ 越小。一般可以使用如下的衰减函数：

$f(|t_{ui}-t_{uj}|)=\frac{1}{1 + \alpha |t_{ui}-t_{uj}|}$

$\alpha$ 是时间衰减函数，可以自己调节。

同样的，也可以根据时间信息改进预测公式：

$p(u,i)=\sum_{j\in N(u)} sim(i, j) \frac{1}{1 + \beta|t_0-t_{uj}|}$

其中 $t_0$ 是当前时间，即 $u_{tj}$ 越靠近 $t_0$ ，和物品j相似的物品就会在用户u的推荐列表中获得越高的排名， $\beta$ 是时间衰减参数。

5.1.3 时间上下文相关的UserCF算法

与ItemCF相似，对于UserCF算法也可以加入时间信息进行改进。

首先是用户相似度计算公式，不加时间信息的是：

$w_{uv}=\frac{|N(u) \bigcap N(v)|}{\sqrt{|N(u)||N(v)|}}$

加入时间信息的相似度计算公式如下：

$w_{uv}=\frac{\sum_{i \in N(u) \bigcap N(v)}\frac{1}{1+\alpha|t_{ui}-t_{vi}|}}{\sqrt{|N(u)||N(v)|}}$

同样的，不加时间信息的预测公式如下：

$p(u,i)=\sum_{v\in S(u, K)} w_{uv}r_{vi}$

加入时间衰减后的预测公式为：

$p(u,i)=\sum_{v\in S(u, K)} w_{uv}r_{vi} \frac{1}{1 + \alpha|t_0-t_{vi}|}$

5.1.4 时间段图模型

这里同样可以用图模型进行推荐。在图的构建过程中，需要加入时间信息，即时间段图模型。

时间段图模型 $S_U, I, S_I, E, w, \sigma)$ 也是一个二分图。 $U$ 是用户节点集合， $S_U$ 是用户时间段节点集合。一个用户时间段节点 $v_{ut}\in S_U$ 会和用户u在时刻t喜欢的物品通过边相连。 $I$ 是物品节点集合， $S_I$ 是物品时间段节点集合。一个物品时间段节点 $v_{it} \in S_I$ 会和所有在时刻t喜欢物品i的用户通过边相连。E是边集合，它包含了3种边：(1) 如果用户u对物品i有行为，那么存在边 $e(v_u, v_i)\in E$ ；(2)如果用户u在t时刻对物品i有行为，那么就存在两条边 $e(v_{ut}, v_i)$ ， $e(v_u, v_{it})\in E$ 。 $w (e)$ 定义了边的权重， $\sigma(e)$ 定义了顶点的权重。

下图就是一个简单的时间段图模型：

在这个图上之间用PersonalRank方法，需要在全图上进行迭代计算，所以时间复杂度比较高。因此可以用一种路径融合算法，来计算图上两个顶点的相关性：

一般来说，图上两个相关性比较高的顶点一般具有如下特征：

两个顶点之间有很多路径相连；
两个顶点之间的路径比较短；
两个顶点之间的路径不经过出度比较大的顶点。

从这3条原则出发，路径融合算法首先提取出两个顶点之间长度小于一个阈值的所有路径，然后根据每条路径经过的顶点给每条路径赋予一定的权重，最后将两个顶点之间所有路径的权重之和作为两个顶点的相关度。

假设 $P={v_1, v_2, ..., v_n}$ 是连接顶点 $v_1$ 和 $v_n$ 的一条路径，这条路径的权重 $\Gamma$ 取决于这条路径经过的所有顶点和边：

$\Gamma(P)=\sigma(v_n)\prod_{i=1}^{n-1} \frac{\sigma(v_i)·w(v_i, v_{i+1})}{|out(v_i)|^\rho}$

这里 $o u t (v)$ 是顶点v指向的顶点集合， $∣ o u t (v) ∣$ 是顶点v的出度， $\sigma(v_i) \in (0, 1]$ 定义了顶点的权重， $w(v_i, v_{i+1}) \in (0, 1]$ 定义了边 $e(v_i, v_{i+1})$ 的权重。上面的定义符合上面3条原则的后两条。首先，因为 $\frac{\sigma(v_i)·w(v_i, v_{i+1})}{|out(v_i)|^\rho} \in (0, 1)$ ，所以路径越长n越大， $\Gamma(P)$ 就越小。同时，如果路径经过了出度大的顶点v’，那么因为 $∣ o u t (v^{'}) ∣$ 比较大，所以 $\Gamma(P)$ 也会比较小。

在定义了一条路径的权重后，就可以定义顶点之间的相关度。对于顶点v和v’，令 $p (v, v^{'}, K)$ 为这两个顶点间距离小于K的所有路径，那么这两个顶点之间的相关度可以定义为：

$v')=\sum_{P \in P(v, v', K)}\Gamma(P)$

对于时间段图模型，所有边的权重都定义为1，而顶点的权重 $\sigma(v)$ 定义如下：

$\sigma(v) = \left\{ \begin{array}{rl} 1- \alpha & v \in U \\ \alpha & v \in S_U \\ 1 - \beta & v \in I\\ \beta & v \in S_I \end{array} \right.$

这里， $\alpha, \beta \in [0, 1]$ 是两个参数，控制了不同顶点的权重。

5.2 地点上下文推荐

地点上下文信息的出现方式有三种：

用户，用户位置，物品，评分
用户，物品，物品位置，评分
用户，用户位置，物品，物品位置，评分

5.2.1 用户、用户位置、物品、评分

对第一种地点信息的数据来说，一般用金字塔模型进行推荐。举个例子：

假设有一个来自中国江苏南京的用户。首先根据所有用户的行为利用某种推荐算法（假设是ItemCF）给他生成推荐列表，然后利用中国用户的行为给他生成第二个推荐列表，以此类推，用中国江苏的用户行为给该用户生成第三个推荐列表，并利用中国江苏南京的用户行为给该用户生成第四个推荐列表。然后，按照一定的权重将这4个推荐列表线性相加，从而得到给该用户的最终推荐列表。如下图所示：