思路:下载MovieLens的数据集,对数据集进行函数定义,定义各数据列的名称,根据上一篇Python写出简单的推荐系统(一) 文中的recommendations.py 的用户相似度进行推荐。
下载MovieLens的地址: http://grouplens.org/datasets/movielens/(选择ml-100k.zip), 下载后的路径可以是和recommendations.py相同,也可是任意Python下面的其他地方,后面会针对两种情况做相关说明。
将下列Python 代码添加到之前recommendations.py 里面:
def loadMovieLensTrain(filename='u1.base'):
str1 ='./ml-100k/'
#加载数据
prefs={}
for line in open(str1+filename,'r'):
(user,movieid,rating,ts)=line.split('\t')
prefs.setdefault(user,{})
prefs[user][movieid]=float(rating)
return prefs
def loadMovieLensTest(filename='u1.test'):