推荐系统实践(五)----基于图的推荐算法

本文介绍了如何将用户行为数据表示为二分图,并详细讲解了基于图的推荐算法PersonalRank的工作原理。通过随机游走计算每个物品节点的访问概率,从而生成推荐列表。此外,还讨论了算法的优化方案,包括减少迭代次数和矩阵转化方法。
摘要由CSDN通过智能技术生成

  基于图的模型( g r a p h − b a s e d m o d e l graph-based model graphbasedmodel)是推荐系统中的重要内容。在研究基于图的模型之前,首先需要将用户行为数据表示成图的形式。这里我们将用户行为数据用二分图表示,例如用户数据是由一系列的二元组(也可以使用列表)组成,其中每个元组 ( u , i ) (u,i) (u,i) 表示用户 u u u 对物品 i i i 产生过行为。下图为 A A A, B B B, C C C 用户感兴趣的音乐:

  产生的二分图模型如下:

  将用户行为表示为二分图模型后,下面的任务就是在二分图上给用户进行个性化推荐。如果将个性化推荐算法放到二分图模型上,那么给用户 u u u 推荐物品的任务就可以转化为度量用户顶点 v u v_u vu 和与 v u v_u vu 没有边直接相连的物品节点在图上的相关性,相关性越高的物品在推荐列表中的权重就越高。
  度量图中两个顶点之间相关性的方法很多,但一般来说图中顶点的相关性主要取决于下面3个因素:
    1. 两个顶点之间的路径数;
    2. 两个顶点之间路径的长度;
    3. 两个顶点之间的路径经过的顶点。
  而相关性高的一对顶点一般具有如下特征:
    1. 两个顶点之间有很多路径相连;
    2. 连接两个顶点之间的路径长度都比较短;
    3. 连接两个顶点之间的路径不会经过出度比较大的顶点。

  我们可以举个例子来说明,如上图,用户 A A A 没有对《故乡的原风景》《偷功》有直接表达喜好,但是可以通过 { A , 英 雄 的 黎 明 , B , 故 乡 的 原 风 景 } \{A, 英雄的黎明, B, 故乡的原风景\} { A,,B,} { A , 最 后 的 莫 西 干 人 , B , 故 乡 的 原 风 景 } \{A, 最后的莫西干人, B, 故乡的原风景\} { A,西,B,} 两条路径为 3 3 3 的路径对《故乡的原风景》产生联系,同样也可以通过 { A , 最 后 的 莫 西 干 人 , C , 偷 功 } \{A, 最后的莫西干人, C, 偷功\} { A,西,C,} { A , 最 后 的 莫 西 干 人 , B , 偷 功 } \{A, 最后的莫西干人, B, 偷功\} { A,西,B,} 两条路径为 3 3 3 的路径对《偷功》产生联系。那么,用户 A A A 与《偷功》之间的相关性要高于用户 A A A 与《故乡的原风景》,因而《偷功》在用户 A A A 的推荐列表中应该排在《故乡的原风景》之前。而 { A , 最 后 的 莫 西 干 人 , C , 偷 功 } \{A, 最后的莫西干人, C, 偷功\} { A,西,C,} 经过点的出度为 { 2 , 3 , 2 , 2 } \{2, 3, 2, 2\} { 2,3,2,

  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值