原始数据:20世纪90年代末到20世纪初由MovieLens用户提供的电影评分数据,包括三个表,电影评分,电影信息(年代和风格)以及用户信息(年龄,邮编,性别和职业等),数据存储类型为.dat
分析目的:
1、想知道评分排名前十和后十的电影都是什么?
2、想知道不同的年龄段喜欢的电影风格分别是什么?
3、想知道男性和女性分别最喜欢和最讨厌的电影是哪部?
数据加载:
unames = ['user_id','gender','age','occupation','zip'] rnames = ['user_id',<