基于用户的协同过滤算法的Python实现

最新推荐文章于 2024-07-03 16:15:51 发布

AnryYang

最新推荐文章于 2024-07-03 16:15:51 发布

阅读量1.2w

点赞数 13

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/anryyang/article/details/23563237

版权

基于用户的协同过滤算法也被称为最近邻协同过滤或KNN (K．Nearest-Neighbor,K最近邻算法)。其核心思想就是，首先根据相似度计算出目标用户的邻居集合，然后用邻居用户评分的加权组合来为目标用户作推荐。

通常这些算法都可以总结成三步：

首先，使用用户已有的评分来计算用户之间的相似度；
然后，选择与目标用户相似度最高的K个用户，通常把这些用户称为邻居；
最后，通过对邻居用户的评分的加权平均来预测目标用户的评分。为了方便说明，我们把系统中用户的集合记为U。物品的集合记为I，用户u,v∈U，物品i,j∈I，是用户对物品的评分，而用户u和v之间的相似度记为，用一个m×n的矩阵来表示所个用户对玎个物品的评分情况。

用来衡量用户之间的相似性方法有很多，最常见的有两种：Pearson相关系数、余弦相似度以及调整余弦相似度。

Pearson相关系数将两个用户共同评分的n个项目看做一组向量，计算两个用户在这n个项目上评分的相关性，减去用户平均评分是基于用户评分尺度的考量，公式如下：

其中是用户u和v都评过分的项目的集合，是用户u所有评分的平均分。

余弦相似度则是把用户的评分（包括所有项目，未评过分的项目分数则为0）看作是一个向量，通过计算两个向量夹角的余弦来衡量用户之间的相似性，其定义如公式如下：

得到用户相似度后，接下来的工作就是对近邻用户下载过的应用进行评分预测，公式如下：

其中得到的就是用户u对物品i的评分的预测，K是邻居的集合也就是和用户u最相似的用户的集合。

Python代码如下：

最低0.47元/天解锁文章

关注

13
点赞
踩
47

收藏

觉得还不错? 一键收藏
4
评论
基于用户的协同过滤算法的Python实现

基于用户的协同过滤算法也被称为最近邻协同过滤或KNN (K．Nearest-Neighbor,K最近邻算法)。
复制链接

扫一扫

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。