import pandas as pd
unames = ['user_id', 'gender', 'age', 'occupation', 'zip']
users = pd.read_table('ml-1m/users.dat', sep='::', header=None, names=unames)
# 用python解析会出现警告
print(len(users))
users.head(5)
user_id gender age occupation zip
0 1 F 1 10 48067
1 2 M 56 16 70072
2 3 M 25 15 55117
3 4 M 45 7 02460
4 5 M 25 20 55455
rating_names = ['user_id', 'movie_id', 'rating', 'timestamp']
ratings = pd.read_table('ml-1m/ratings.dat', sep='::', header=None, names=rating_names)
ratings.head(5)
user_id movie_id rating timestamp
0 1 1193
Day25(pandas电影评分数据实例分析,数据的处理分类提取)
该博客通过pandas分析电影评分数据,包括查看特定ID电影的男性与女性评分差异,按性别计算评分差值并排序,统计不同电影的评分数量,计算电影平均得分,最后找出热度与评分双高的电影。
摘要由CSDN通过智能技术生成