电影数据分析
下载数据
https://grouplens.org/datasets/movielens/
之前一直都不太理解绝对路径和相对路径:
今天才有点明白,大概就是就说,你写了一段代码你要发给别人,然后你就打了个包,你代码里面那就不能用绝对路径,要不别人打不开。
数据读取
import pandas as pd
unames = ('user_id','gender','age','occupation','zip')
users = pd.read_table(r'C:\Users\Administrator\Desktop\ml-1m\users.dat',sep='::',header=None,names=unames)
print(len(users))
rating_names = ['user_id', 'movie_id', 'rating', 'timestamp']
ratings = pd.read_table(r'C:\Users\Administrator\Desktop\ml-1m\ratings.