用MovieLens数据集做推荐（Python推荐系统二）

最新推荐文章于 2024-08-13 17:30:00 发布

Susie_小枫

最新推荐文章于 2024-08-13 17:30:00 发布

阅读量2.4w

点赞数 9

分类专栏：推荐系统文章标签： python3 推荐系统 MovieLens

本文链接：https://blog.csdn.net/luzuiwutong/article/details/42718375

版权

本文介绍如何利用MovieLens数据集在Python中建立推荐系统。首先下载ml-100k数据集，然后在recommendations.py中定义数据路径和相关函数。通过运行代码，测试了数据加载和推荐功能，成功获取了用户评分数据和推荐项。

摘要由CSDN通过智能技术生成

思路：下载MovieLens的数据集，对数据集进行函数定义，定义各数据列的名称，根据上一篇Python写出简单的推荐系统（一）文中的recommendations.py 的用户相似度进行推荐。

下载MovieLens的地址： http://grouplens.org/datasets/movielens/

（选择ml-100k.zip）, 下载后的路径可以是和recommendations.py相同，也可是任意Python下面的其他地方，后面会针对两种情况做相关说明。

将下列Python 代码添加到之前recommendations.py 里面：

def loadMovieLensTrain(filename='u1.base'):
    str1 ='./ml-100k/'     

    #加载数据
    prefs={}
    for line in open(str1+filename,'r'):
        (user,movieid,rating,ts)=line.split('\t')
        prefs.setdefault(user,{})
        prefs[user][movieid]=float(rating)
    return prefs

def loadMovieLensTest(filename='u1.test'):