推荐系统实践-利用上下文信息(5)

wolf_qu

于 2022-10-14 11:26:34 发布

阅读量429

点赞数

文章标签：推荐算法算法机器学习

本文链接：https://blog.csdn.net/wolf_qu/article/details/127283395

版权

5.1 时间上下文信息

在进行推荐时，我们还需要考虑到用户所处的时间，季节，地点，心情等上下文信息来进行推荐(比如我们不能在冬天给用户推荐T恤等)。

5.1.1 时间效应

1.用户的兴趣是变化的：随着年龄增长，喜欢的电视剧可能会从动画片变为文艺片；喜欢的书籍也会随着自己知识的增加从入门书籍变为专业书籍等

2.物品具有生命周期，电影刚上线的时候可能被很多人关注，但是过一段时间，热度可能就降下去了

3.季节效应：反映时间本身对用户的影响，夏天吃冰淇淋，冬天吃火锅，夏天穿T恤，冬天穿棉袄等。

5.1.2 系统时间特性的分析

给定时间信息后，推荐系统由一个静态系统变为时变的系统，用三元组(u,i,t)表示用户u在时刻t对物品i产生了行为。通过以下信息研究系统的时间特性：

1.数据集每天独立用户数的增长情况

2.系统的物品变化情况

3.用户访问情况

5.1.3 推荐系统的实时性

用户兴趣是不断变化的，其变化体现在用户不断增加的新行为中。一个实时的推荐系统需要能够实时响应用户新的行为，让推荐列表不断变化，从而满足用户不断变化的兴趣。

要求在每个用户访问推荐系统时，都根据用户这个时间点前的行为实时计算推荐列表，推荐算法需要平衡考虑用户的近期行为和长期行为，即要让推荐列表反应出用户近期行为所体现的兴趣变化，又不能让推荐列表完全受用户近期行为的影响，要保证推荐列表对用户兴趣预测的延续性

5.1.4 推荐算法的时间多样性

推荐系统每天推荐结果的变化程度被定义为推荐系统的时间多样性，提高时间多样性需要分两步解决：首先需要保证推荐系统能够在用户有新行为后及时调整推荐结果，其次用户没有新行为时也需要经常变化一下。

5.1.5 时间上下文推荐算法

1.最近最热门

最简单的非个性化推荐算法就是给用户推荐最近最热门的物品，给定时间T，物品i最近的流行度 $n_{i}(T)$ 定义如下：

$n_{i}(T)=\sum_{(u,i,t)\in Train,t<T}\frac{1}{1+\alpha(T-t)}$

其中α是时间衰减参数。

2.时间上下文相关的ItemCF算法

回顾ItemCF算法主要由两个步骤组成：1.利用用户行为离线计算物品之间的相似度；2.根据用户的历史行为和物品相似度，给用户做在线个性化推荐。加入时间信息考虑两者均有一些变化：

物品相似度：用户在相隔很短时间内喜欢的物品具有更高的相似度，即今天和昨天看的电影比今天和一年前看的电影有更高的相似度

在线推荐：加重用户近期行为的权重，优先推荐和用户近期喜欢物品相似的物品

加入时间信息后，对ItemCF算法进行改进，计算物品相似度公式如下：

$sim(i,j)=\frac{\sum_{u\in N(i)\cap N(j)}f(|t_{ui}-t_{uj}|)}{\sqrt{|N(i)||N(j)|}}$

和普通的ItemCF相比，在分子中引入了和时间有关的衰减项 $f(|t_{ui}-t_{uj}|)$ ，其中 $t_{ui}$ 是用户u对物品i产生行为的时间，f函数的含义是用户u对物品i产生行为的时间和对物品j产生行为的时间距离越远，f越小，即衰减函数，f可以取如下公式：

$f(|t_{ui}-t_{uj}|)=\frac{1}{1+\alpha|t_{ui}-t_{uj}|}$

α是时间衰减参数，在不同情况下取值不同，若用户兴趣变化很快，α应取值大一点，反之则应该小一点。

时间信息不仅对相似度矩阵有影响，对预测公式也有影响，用户的行为应该和用户最近的行为关系更大，因此，我们可以通过如下公式修正预测公式：

$p(u,i)=\sum_{j\in N(u)\cap S(i,k)}sim(i,j)\frac{1}{1+\beta|t_{0}-t_{uj}|}$

其中 $t_{0}$ 为当前时刻。

3. 时间上下文相关的UserCF算法

回顾UserCF算法的基本思想：给用户推荐和他兴趣相似的其他用户喜欢的物品，可以从以下两个方面利用时间信息改进UserCF算法：

1.用户兴趣相似度：若两个用户同时喜欢相同的物品，应该有更大的兴趣相似度

2.相似用户的最近行为：应该给用户推荐相似用户最近的行为，而不是很久以前的行为

用户相似度计算公式可以改为：

$w_{uv}=\frac{\sum_{i\in N(u)\cap N(v)}\frac{1}{1+\alpha|t_{ui}-t_{vi}|}}{\sqrt{|N(i)|\cup |N(j)|}}$

相比于原来公式，在分子部分添加了一个衰减函数，u和v对i产生行为时间相隔越久则兴趣相似度越小。

推荐部分同样加入时间信息考虑，公式改为：

$p(u,i)=\sum_{v\in S(u,k)}w_{uv}r_{vi}\frac{1}{1+\alpha(t_0-t_{vi})}$

5.1.6 时间段图模型

时间段图模型是将时间信息建模到图模型中， $G(U,S_{U},I,S_{I},E,w,\sigma)$ 也是一个二分图，其中U是用户集合， $S_{U}$ 是用户时间段节点集合，I是物品节点集合， $S_{I}$ 是物品时间段集合，E是边集合，w为边的权重，σ为顶点的权重，若用户A在时刻2对物品b产生了行为，则会在图中增加三条边，首先创建四个顶点：用户顶点A，用户时间段顶点A:2，物品顶点b，物品时间段顶点b:2。然后在图中增加3条边，(A,b)、(A:2,b)、(A,b:2)。

相关性较高的顶点一般有如下特征：

1.两个顶点之间有很多路径相连

2.两个顶点之间的路径比较少

3.两个顶点之间的路径不经过出度比较大的顶点

路径融合算法：首先提取出两个顶点之间长度小于一个阈值的所有路径，然后根据每条路径经过的顶点给每条路径赋予一定的权重，最后将两个顶点之间所有权重之和作为两个顶点之间的相关度。

假设 $P=\{v_1,v_2,\ldots,v_n\}$ 是连接顶点 $v_1$ 和 $v_n$ 的一条路径，这条路径的权重取决于经过的所有顶点和边：

$T(P)=\sigma(v_n)\prod _{i=1}^{n-1}\frac{\sigma(v_i)w(v_i,v_{i+1})}{|out(v_i)|^{\rho}}$

其中out(v)是顶点v指向顶点的集合，|out(v)|是顶点v的出度， $\sigma(v_i)\in (0,1]$ 定义了顶点的权重， $w(v_i,v_{i+1})\in (0,1]$ 定义了边的权重，因此 $\frac{\sigma(v_i)w(v_i,v_{i+1})}{|out(v_i)|^{\rho}}\in (0,1)$ ,所以n越大，T(P)就会越小，且考虑了路径中顶点的出度，符合后两条。