推荐算法-协同过滤代码问题汇总

1.DataFrame
DataFrame是python中panda库里的方法,用法如下:

users = [“User1”,“User2”,“User3”,“User4”,“User5”]items = [“Item A”,“Item B”,“Item C”,“Item D”,“Item E”]# 用户购买记录数据集datasets = [ [1,0,1,1,0], [1,0,0,1,1], [1,0,1,0,0], [0,1,0,1,1], [1,1,1,0,1],]import pandas as pd
df = pd.DataFrame(datasets, columns=items, index=users)print(df)

运行结果是这样的:

由上我们可以看出DataFrame是一种表格型数据结构,它含有一组有序的列,每列可以是不同的值。DataFrame既有行索引,也有列索引
其中行索引是index,列索引是columns
问题一:

from sklearn.metrics import jaccard_similarity_score

无法引用jaccard_similarity_score
可能的问题:库的版本不统一

解决 : 版本更新问题,以后调用杰卡德函数直接使用一下的调用代码

from sklearn.metrics import jaccard_score

问题二:
报错代码:

pairwise_distances(df, metric="jaccard")

错误:AttributeError: ‘DataFrame’ object has no attribute ‘dtype’
错误原因:scikit-learn从0.20.1不再自动修改numpy语法。所以需要养成更加规范的书写习惯解决
以上代码更正为:

pairwise_distances(df.values, metric="jaccard")`

问题三:
报错代码:

rs_result -= set(df.ix[user].replace(0,np.nan).dropna().index)

错误:AttributeError: ‘DataFrame’ object has no attribute ‘dtype’
报错原因:在pandas的1.0.0版本开始,移除了Series.ix and DataFrame.ix 方法。
解决:使用DataFrame的loc方法或者iloc方法进行替换
拓展:pandas:ix 、loc 、 iloc区别、.at、.iat和.get_value
借鉴链接:
https://blog.csdn.net/HHG20171226/article/details/101567357

  • 8
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,针对这个问题,我可以为你提供一些关于Python电影推荐系统和协同过滤算法的基本知识和实现方法。 首先,电影推荐系统是一种常见的个性化推荐系统,在电影网站和应用程序中广泛应用。它可以根据用户的历史观看记录、评分、喜好等信息,为用户推荐他们可能会喜欢的电影。 协同过滤算法是电影推荐系统中常用的算法之一。它基于用户对电影的历史打分记录,寻找与当前用户兴趣相似的其他用户或电影,然后根据这些相似用户或电影的评分来预测当前用户对其他电影的评分。协同过滤算法主要分为基于用户的协同过滤和基于物品的协同过滤两种。 Python中有很多电影推荐系统的实现库和工具,如Surprise、LightFM、TensorFlow等。其中Surprise是一个基于Python的推荐系统开发框架,支持多种推荐算法,包括协同过滤算法的SVD和NMF。 以下是一些Python实现协同过滤算法的示例代码: 使用Surprise库实现基于SVD的协同过滤算法: ```python from surprise import SVD from surprise import Dataset from surprise import accuracy from surprise.model_selection import train_test_split # 加载数据集 data = Dataset.load_builtin('ml-100k') # 切分数据集 trainset, testset = train_test_split(data, test_size=.25) # 构建模型 algo = SVD() # 训练模型 algo.fit(trainset) # 预测评分 predictions = algo.test(testset) # 计算RMSE误差 accuracy.rmse(predictions) ``` 使用Surprise库实现基于NMF的协同过滤算法: ```python from surprise import NMF from surprise import Dataset from surprise import accuracy from surprise.model_selection import train_test_split # 加载数据集 data = Dataset.load_builtin('ml-100k') # 切分数据集 trainset, testset = train_test_split(data, test_size=.25) # 构建模型 algo = NMF() # 训练模型 algo.fit(trainset) # 预测评分 predictions = algo.test(testset) # 计算RMSE误差 accuracy.rmse(predictions) ``` 以上是一些关于Python电影推荐系统和协同过滤算法的基本知识和实现方法。如果你有其他问题或需要更详细的解答,请随时提出。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值