python实现基于物品的隐式协同过滤,使用movielens数据集测试

该博客介绍了一种解决用户量增加导致的扩展性和稀疏性问题的方法——基于物品的协同过滤。通过计算物品之间的相似度,并调整余弦分布减去用户平均评分,实现了物品间的推荐。代码中展示了如何计算前100部电影的相似度矩阵,并提供了归一化和反归一化评分的函数,以及预测用户对未评分电影的评分的函数。
摘要由CSDN通过智能技术生成

# 在distance里我们使用的主要是基于用户的协同过滤,但是这样存在两个主要的问题
# 1.扩展性问题,随着用户量变多计算量也会增长,当上百万用户时扩展性就会成为一个问题
# 2.稀疏性,稀疏性,例如网上有上百万本书,用户评价过的只占一小部分,所以可能找不到最近邻居
# 因此,可以使用基于物品的过滤
# 调整余弦分布 减去了用户的平均评分
# consine(item1,item2) = 用户对item1,item2的乘积和/用户对item1,2平方和开根号相乘

# 基于物品的推荐把用户行为通过归一化的形式转换为了权重

#代码如下,写得不好的地方还需要改进

import pandas as pd
import numpy as np
path = 'E:\data\ml-latest-small'
# 9724部电影,id 1-170875
movies = pd.read_csv(path + '\movies.csv')
# 100835条打分记录
ratings = pd.read_csv(path + '\\ratings.csv')
# links = pd.read_csv(path + '\links.csv')
# tags = pd.read_csv(path + '\\tags.csv')
data = pd.merge(ratings, movies, on='movieId')
'''
data.nunique()
userId         610
movieId       9724

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值