MovieLens 1M数据集含有来自6000名用户对4000部电影的100万条评分数据。它分为三个表:评分,用户信息和 电影信息。将该数据解压出来以后,可以通过pandas.read_table将各个表分别读到一个pandas DataFrame对象中
import pandas as pd
import numpy as np
import matplotlib as plt
unames=['user_id','gender','age','occupation','zip']
users=pd.read_table('users.dat',sep='::',header=None,names=unames,engine='python')
rnames=['user_id','movie_id','rating','timestamp']
ratings=pd.read_table('ratings.dat',sep='::',header=None,names=rname