个性化推荐算法和二部图-论文学习

标签: 推荐算法 Bipartite network pr 链路预测 论文学习
3556人阅读 评论(0) 收藏 举报
分类:

本文为学习论文《Bipartite network projection and personal recommendation》(周涛)的简要备忘笔记。

0,背景简介

一般来说,一个推荐系统由用户user和商品object组成,每一个用户会选择一些商品,记商品集合和用户集合分别如下:

 ,   

如果用户仅仅选择商品而不对其进行评价。那么推荐系统可以完全由一个n×m的邻接矩阵表示,其中如果用户ui选择过了商品oj,那么aij = 1,否则aij =  0。一个合理的假设是你选择的商品都是你喜欢的,一个推荐系统的目的是要预测你对于没有选择过的商品的喜爱程度。


1,GRM(global ranking method )算法

为商品oi的度,该算法按照度下降对商品进行排序并且向用户推荐排序最靠前的商品。尽管该算法因为缺乏个性化而表现不尽如人意,但是由于其简单而被广泛的应用。


2,CF算法

至今使用最广泛的个性化推荐算法是CF(collaborative filtering ),该算法基于用户的相似性进行推荐,即对一个特定用户的推荐主要使用与其相似的用户的数据。用户ui和用户uj的相似性可由以下的公式计算得到:

                                                       

其中k(ui)为用户的度。对于任意一个用户商品对ui-oj,如果用户ui没有选择oj,该算法会计算用户ui选择oj的得分vij

公式如下图所示:

                                                         

简单的分析下式子中的分子的意思:用户ui购买商品oj的得分vij = sum(该用户和第l个用户的相似性×第l个用户是否购买了该商品)。有两个因素可以导致vij变大,(1)商品oj的度很大(理解为买的很好或者很受欢迎)。(2),存在一个和预测用户喜好很像的人。那么前者表现的是全局化的信息,后者表现的是个性化的信息。针对任意用户ui,对他所有的没有买过的商品进行得分的排序就实现了个性化的推荐。


3,NBI(network-based inference)算法

 (0)二部图:网络中的节点分为两个集合(X,Y),而节点直接的连接只能发生在两个集合之间。

 (1)算法思想:(一种加权方法)

                                                    

                                                   

                                                   

上图表明了在二部图中资源的流动过程。上面的3个是X节点,下面的4个是Y节点。整个资源的流动过程包括两步:首先资源从X流向Y,然后重新流回X。经过着两步之后,X节点上资源由x,y,z变为x‘,y’和z‘。可以通过如下的计算得到:

                                                        

考虑更加一般的二部图G(X,Y,E), 其中E是边的集合,集合X和Y中的节点分别记为x1,x2,...xn和y1,y2,...,ym,X集合中节点的初始资源量为f(xi)。当第一步完成之后,资源由集合X流向了Y,那么可以通过以下的式子计算Y中的各个节点分配到的资源量:

                                                         

其中k(xi)为xi的度,ail为n×m的邻接矩阵,如下所以:

                                                        

接下是第二步,所有的资源流回X,之后集合X中的节点的资源分配量可由下式计算得出:

                                                      

或者可以写为:

                                                       

其中:

wij可以理解为,在j的眼中i的重要性。

(2)NBI算法

直接利用上述介绍的二部图的加权方法提出一种推荐算法。框架是很简单的:首先将用户-商品二部图压缩为商品一部图,将得到的加权网络记为G。对于给定的用户,对该用户已经选择过的商品分配资源量,为了简单初始资源量的分配按照下面的式子给出:f(oj) = aji.也就是说如果用户选择过了商品oj,那么初始资源量为1,否则为0。之后根据前面所讨论的加权方法。最后可以得到商品上的资源量为:

                                                       

那么对于任意一个用户,我们对他所有的未选择过的商品oj按照以上计算的f ’(oj)降序排列,向用户推荐最后资源量最大的那些商品。

C语言代码实现http://blog.csdn.net/robin_xu_shuai/article/details/51533940

查看评论

推荐算法——基于图的推荐算法PersonalRank算法

实验结果: #coding=utf-8 def PersonalRank(G, alpha, root, max_step): rank = dict() for x in ...
 • google19890102
 • google19890102
 • 2016年06月21日 13:35
 • 6592

推荐算法学习-资料整理

1.推荐系统经典论文文献及业界应用 2.LRSLibrary 64个低秩+稀疏矩阵/张量分解的算法库 加长版49条 http://t.cn/R7eXvdJ 3.一条广告含用户,广告和查...
 • Chloezhao
 • Chloezhao
 • 2016年11月15日 12:10
 • 1123

基于大数据的推荐算法研究(1)

孙远帅. 基于大数据的推荐算法研究[D]. 厦门大学, 2014. 读的一篇论文的总结总览基于项目层次结构的推荐算法,并结合Hadoop技术实现矩阵分解算法。 改进均衡相似度的余弦距离和皮尔逊相关系...
 • yimiaomochu
 • yimiaomochu
 • 2017年03月14日 10:20
 • 1783

推荐算法论文

 • 2017年12月11日 10:07
 • 353KB
 • 下载

推荐算法从入门、进阶到高级

推荐的算法的重要性我就不多说了,反正是各种重要。 最近一段时间结合部门业务,我仔细的研究了各种推荐算法,在此我会附上相应的书籍和文献,帮助大家迅速的入门进阶,最终进入推荐算法的高手行列。 推荐算法分为...
 • love_data_scientist
 • love_data_scientist
 • 2017年09月03日 00:14
 • 758

《推荐系统》基于图的推荐算法

1:概述 2:原理简介 3:代码实现 一:概述         基于图的模型(graph-based model)是推荐系统中的重要内容。其实,很多研究人员把基于邻域的模型也称为基于图的模型,因为可...
 • Gamer_gyt
 • Gamer_gyt
 • 2016年06月16日 20:57
 • 9510

算法讲解:二分图匹配

二分图匹配,自然要先从定义入手,那么二分图是什么呢? 二分图: 二分图又称作二部图,是图论中的一种特殊模型。 设G=(V,E)是一个无向图,如果顶点V可分割为两个互不相交的子集(A,B),并且图中的每...
 • thunderMrbird
 • thunderMrbird
 • 2016年08月23日 10:17
 • 17932

二分图匹配——匈牙利算法和KM算法

二分图的概念二分图又称作二部图,是图论中的一种特殊模型。 设G=(V, E)是一个无向图。如果顶点集V可分割为两个互不相交的子集X和Y,并且图中每条边连接的两个顶点一个在X中,另一个在Y中,则称图G...
 • C20180630
 • C20180630
 • 2017年04月14日 20:41
 • 4883

推荐系统之基于二部图的个性化推荐系统原理及C++实现

推荐系统之基于二部图的个性化推荐系统原理及C++实现 时间 2014-12-27 16:43:00  博客园-原创精华区 原文  http://www.cnblogs.com/90zeng/p...
 • u014114990
 • u014114990
 • 2015年09月01日 22:35
 • 542

用PersonalRank实现基于图的推荐算法

分类: 推荐系统2013-08-18 16:46 1571人阅读 评论(3) 收藏 举报 推荐系统PersonalRank 今天我们讲一个下怎么使用随机游走算法PersonalRank...
 • pi9nc
 • pi9nc
 • 2014年05月29日 08:43
 • 9285
  个人资料
  持之以恒
  等级:
  访问量: 22万+
  积分: 3277
  排名: 1万+
  最新评论