基于用户的协同过滤算法的电影推荐系统

最新推荐文章于 2025-03-30 14:21:53 发布

行者小朱

最新推荐文章于 2025-03-30 14:21:53 发布

阅读量4.9w

点赞数 34

分类专栏： DM&DL&ML

本文链接：https://blog.csdn.net/u012050154/article/details/52268057

版权

DM&DL&ML 专栏收录该内容

21 篇文章

订阅专栏

上一篇讲解了推荐算法的分类，这里电影推荐系统具体分析一下

第一步：建立用户电影矩阵模型

如表1所示，协同过滤算法的输入数据通常表示为一个m*n的用户评价矩阵Matrix，m是用户数，n是电影数，Matrix[ij]表示第i个用户对第j个电影的评价：

第二步：发现兴趣相似的用户

这一阶段，主要完成对目标用户最近邻居的查找，通过计算目标用户与其他用户之间的相似度，得到与目标用户最近的邻居集。度量用户间相似性：设N(u)为用户u喜欢的电影集合，N(v)为用户v喜欢的电影集合，将上一步中每行记录视为一个向量，那么u和v的相似度可通过以下进行计算：
(a)采用Jaccard公式：W_uv=(|N(u)∩N(v)|)/(|N(u)∪N(v)|)
(b)余弦相似度计算：W_uv=(|N(u)∩N(v)|)/(√|N(u)||N(v)|)
这里选择余弦公式进行相似度度量计算，假设目前共有4个用户(A、B、C、D)，5部电影(a、b、c、d、e)，用户与电影的关系如下图所示：

W_AB=(|{a,b,d}∩{a,c}|)/(√|{a,b,d}||{a,c}|)=1/(√6)

W_AC=(|{a,b,d}∩{b,e}|)/(√|{a,b,d}||{b,e}|)=1/(√6)

W_AD=(|{a,b,d}∩{c,d,e}|)/(√|{a,b,d}||{c,d,e}|)=1/3

而这种方法的时间复杂度是O(|U|*|U|)，所以非常耗时。而在上表中可以看到“用户-电影”表是一个稀疏矩阵，即很多时候N(u)^N(v)=0，如果换一下思路，可以首先计算N(u)^N(v)!=0的用户，然后再计算sqrt(N(u)*N(v))。为此可以首先建立“电影-用户”的倒排表，对每部电影都保存电影到用户的列表：