这一篇是紧跟着上一篇基于用户的协同过滤(user-based CF)推荐系统【1】的,这一篇只是把计算相似度的方法换成了余弦相似度,当然最后计算评分的公式也就变了。下面只把有变化的那部分代码贴出来。直接替换到上一篇里面的代码就可以了。
simpleCF.py
part1 += user_movie[u][m]*user_movie[n][m]*1.0
part2 += pow(user_movie[u][m], 2)*1.0
part3 += pow(user_movie[n][m], 2)*1.0
for n, nuw in sorted(userSim[user].items(),key=itemgetter(1),reverse=True)[0:N]:
average_n_rate = average_rating(n) #用户n的平均分
for i, nrating in user_movie[n].items(): #用户n看过电影集合及评分
# filter movies user interacted before
if i in interacted_items:
continue
pred.setdefault(i,0)
pred[i] += nuw * nrating
sumUserSim += nuw
for i, rating in pred.items():
pred[i] = (pred[i]*1.) / sumUserSim
只是simpleCF.py这个文件有点改动,evaluateRecom.py文件没有改动。
Tips:初学推荐系统的朋友可以看看这篇文章,2005年的,比较久了,但是比较基础,里面介绍了
collaboratiofiltering,content-based recommendation, hybrid recommendation,比较全。
http://dl.acm.org/citation.cfm?id=1070751
Toward the Next Generation of Recommender Systems: A Survey of the State-of-the-Art and Possible Extensions