数据集:用的是NetFlix数据集
文件解压包含一下几个文件:
1、README
描述性内容
2、movie_titles.txt
该文件表示电影相关信息
本实例依赖的是training_set.tar下的文件,因数据量比较大,因此随意选取1000个用户来进行实例开发。
# -*- encoding: utf-8 -*-
import os
import json
import random
import math
class FirstRec:
"""初始化函数
filepath:原始文件路径
seed:产生随机数的种子
k:选取的近邻用户数
nitems:为每个用户推荐的电影数
"""
def __init__(self,file_path,seed,k,n_items):
self.file_path=file_path
self.users_1000=self.__select_1000_users()
self.seed=seed
self.k=k
self.n_items=n_items
self.train,self.test=self._load_and_split_data()
#