读书笔记--推荐系统实践（4）

最新推荐文章于 2024-05-30 11:23:26 发布

sean_sysu

最新推荐文章于 2024-05-30 11:23:26 发布

阅读量282

点赞数 1

分类专栏：读书笔记-推荐算法文章标签：读书笔记数据挖掘算法

本文链接：https://blog.csdn.net/sean_sysu/article/details/50927277

版权

读书笔记-推荐算法专栏收录该内容

4 篇文章 0 订阅

订阅专栏

这次主要谈一下对推荐系统中的用户相似度进行的一个改进。
首先有这样的一个现象，有些热门物品是很多人都共同拥有的，并不能代表兴趣所在，如：新华字典等，然而冷门物品往往可以反应兴趣所在，比如，买了数据挖掘导论，一般只有做数据挖掘的人才会买这个书。所以我们在计算用户相似度的时候，可以考虑给热门物品增加一个惩罚项。
这里写图片描述
算法实现如下：

def UserSimilarity(train):
    #build inverse table for item_users
    item_users = dict()
    for u, items in train.items():
        for i in items.keys():
            if i not in items.keys():
                item_users[i] = set()
            item_users[i].add(u)

    #calculate co-rated items between users
    C = dict()
    N = dict()
    for i, users in item_users.items():
        for u in users:
            N[u] += 1
            for v in users:
                if u == v:
                    continue
                C[u][v] += 1/math.log(1+len(users))

    #calculate finial similarity matrix w
    W = dict()
    for u, related_users in C.items():
        for v, cuv in related_users.items():
            W[u][v] = cuv /math.sqrt(N[u]*N(v))
    return W

sean_sysu

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
读书笔记--推荐系统实践（4）

这次主要谈一下对推荐系统中的用户相似度进行的一个改进。首先有这样的一个现象，有些热门物品是很多人都共同拥有的，并不能代表兴趣所在，如：新华字典等，然而冷门物品往往可以反应兴趣所在，比如，买了数据挖掘导论，一般只有做数据挖掘的人才会买这个书。所以我们在计算用户相似度的时候，可以考虑给热门物品增加一个惩罚项。算法实现如下：def UserSimilarity(train): #bui
复制链接

扫一扫