推荐系统实践：基于用户的协同过滤算法原理及实现(含改进算法)

最新推荐文章于 2024-08-12 14:30:51 发布

我是刘刘啊

最新推荐文章于 2024-08-12 14:30:51 发布

阅读量1.8w

点赞数 21

分类专栏：推荐系统文章标签：推荐系统协同过滤基于用户的协同过滤

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37917271/article/details/82498308

版权

本文详细介绍了基于用户的协同过滤算法，包括构建物品-用户倒排表，建立用户相似度矩阵，计算用户相似度，以及针对目标用户生成推荐的方法。还探讨了改进的相似度计算公式以降低热门物品的影响，并介绍了召回率、准确率和覆盖率作为评测指标。最后，通过MovieLens数据集进行了实验验证。

摘要由CSDN通过智能技术生成

总体思路：

1.利用余弦相似度对两两用户计算相似度

1.1 建立物品-用户倒排表

左半部分为训练数据格式，ABCD等是用户，abc等是对应用户喜欢的物品

右半部分物品-用户倒排表，如对于物品a，喜欢它的有用户A和B

1.2 建立用户相似度矩阵

利用物品-用户倒排表，构建用户相似度矩阵，其中的值，如 matrix[A][B]表示用户A和用户B共同喜欢的电影的数量。

1.3 计算用户相似度

遍历用户相似度矩阵中所有的两两用户，根据两两用户共同喜欢的电影的数量，计算用户相似度

计算用户相似度的公式如下：

其中 $_{}$ $W_{uv}$ 表示用户u与v的相似度，作为matrix[u][v]的值，

N(u)表示用户u增有过正反馈的物品集合，N(u)表示用户u增有过正反馈的物品集合。

例如：

或使用改进的用户相似度计算公式：

该公式惩罚了用户u和v共同喜欢的物品中热门物品对他们相似度的影响，以图书为例，如果两个用户都曾经买过《新华字典》，这丝毫不能说明他们的兴趣相似，因为绝大多数中国人小时候都买过《新华字典》。但如果两个用户都买过《数据挖掘导论》，那可以认为他们的兴趣比较相似，因为只有研究数据挖掘的人才会买这本书。换句话说，两个用户对冷门物品采取过同样的行为更能说明他们兴趣的相似度。

i表示用户u和用户v都有过正反馈的物品集合，N(i)表示对物品i有过正反馈的用户数

即分子部分表示 “用户u和v有正反馈的物品数”

2. 针对目标用户u，找到其最相似的K个用户，产生N个推荐

K表示与用户u兴趣相似的用户个数，N表示为用户u推荐的物品数

首先，对用户u，在用户相似度中找到与其相似度最高的K个用户

利用如下的公式计算用户u对物品i的感兴趣程度p(u, i)：

其中，S(u, k)包含和用户u兴趣最接近的K个用户，N(i)是对物品i有过行为的用户集合， $w_{uv}$ 是用户u和用户v的相似度，

最低0.47元/天解锁文章

我是刘刘啊

关注

21
点赞
踩
154

收藏

觉得还不错? 一键收藏
14
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

我是刘刘啊 CSDN认证博客专家 CSDN认证企业博客

码龄8年

14: 原创

39万+: 周排名

230万+: 总排名

18万+: 访问

: 等级

925: 积分

86: 粉丝

148: 获赞

53: 评论

967: 收藏

私信

关注

分类专栏

最新评论

Tensorflow实战：LSTM原理及实现（详解）
silent ark: 路过，刚好刚看过这篇经典文章，是https://colah.github.io/posts/2015-08-Understanding-LSTMs/
Tensorflow实战：LSTM原理及实现（详解）
m0_63690312: 请问LSTM这些结构图出自哪篇文献啊
Tensorflow实战：LSTM原理及实现（详解）
weixin_45991826: 您好我想问一下我下载的tensorflow 1.15.0版本不带model应该怎么办呀，去github下载完一个压缩包不知道该把哪个文件放在TensorFlow里，谢谢
Tensorflow实战：LSTM原理及实现（详解）
qq_46567590: 官网怎么找不到那个reader.py文件了
Tensorflow实战：LSTM原理及实现（详解）
qq_46567590: 这个models模块能发我一下吗

最新文章

目录

评论 14

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。