推荐系统之基于personalrank图游走算法

最新推荐文章于 2022-05-28 20:10:17 发布

置顶 jiang199912

最新推荐文章于 2022-05-28 20:10:17 发布

阅读量503

点赞数

本文链接：https://blog.csdn.net/jiang199912/article/details/106473829

版权

本文深入探讨了图游走算法在推荐系统中的应用，通过具体案例解析算法原理，对比不同实现方式，阐述了用户兴趣度计算的过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在这里插入图片描述
上图是一个二元图，表示了A,B,C用户对abcd物品的感兴趣程度，有连线即为感兴趣。
图游走算法是根据图各节点关系来进行计算的，并且图游走算法不区分用户与作品。
比如我们对用户A进行推荐，那么先初始化对A的感兴趣程度为1，用一个字典rank来存储感兴趣程度
那么rank[‘A’]=1，其余节点均为0
假设游走的概率为alpha，那么停留的概率为(1-alpha)。
那么第一次游走，rank[‘a’] = rank['c] = rank[‘A’]* 1/2* alpha, rank[‘A’] = 1-alpha
可以列出这个公式
在这里插入图片描述
网上的实现代码如下：

import time

def personalRank(G, alpha, root, max_step):
    rank = dict()
    rank = {x:0 for x in G.keys()}
    rank[root] = 1
    start = time.time()
    for k in range(max_step):
        temp = {x:0 for x in G.keys()}
        for i, ri in G.items():
            #每个点都要游走
            for j, rj in ri.items():
                #对相连的其他点进行值的更新
                temp[j] += alpha * rank[i]/(1.0*len(ri))
        #此处更新初始点的值
        temp[root] += (1-alpha);
        #每游走一次更新一下rank
        rank = temp;
    end = time.time()
    print("time:{}".format(end-start))
    
    li = sorted(rank.items(), key = lambda x:x[1], reverse=True)
    for ele in li:
        print("%s:%.3f, \t"%(ele[0], ele[1]))
        
    return rank

if __name__ == '__main__' :
    alpha = 0.8
    G = {'A' : {'a' : 1, 'c' : 1},
         'B' : {'a' : 1, 'b' : 1, 'c':1, 'd':1},
         'C' : {'c' : 1, 'd' : 1},
         'a' : {'A' : 1, 'B' : 1},
         'b' : {'B' : 1},
         'c' : {'A' : 1, 'B' : 1, 'C':1},
         'd' : {'B' : 1, 'C' : 1}}
 
    personalRank(G, alpha, 'A', 50)     #从'A'节点开始游走

在这里插入图片描述
根据我的理解实现代码如下：

def personalRank(G, alpha, root, max_step):
    rank = dict()
    rank = {x:0 for x in G.keys()}
    rank[root] = 1
    start = time.time()
    for k in range(max_step):
        for i, ri in G.items():
            #每个点都要游走
            for j, rj in ri.items():
                #对相连的其他点进行值的更新
                rank[j] += alpha * rank[i]/(1.0*len(ri))
            rank[i] *= (1-alpha);
    end = time.time()
    print("time:{}".format(end-start))
    
    li = sorted(rank.items(), key = lambda x:x[1], reverse=True)
    for ele in li:
        print("%s:%.3f, \t"%(ele[0], ele[1]))
        
    return rank