Day25（pandas电影评分数据实例分析，数据的处理分类提取）

拽紧哥的腿毛

于 2020-06-30 19:09:49 发布

阅读量1k

点赞数 2

分类专栏： numpy

本文链接：https://blog.csdn.net/mh594137514/article/details/107048601

版权

该博客通过pandas分析电影评分数据，包括查看特定ID电影的男性与女性评分差异，按性别计算评分差值并排序，统计不同电影的评分数量，计算电影平均得分，最后找出热度与评分双高的电影。

摘要由CSDN通过智能技术生成

import pandas as pd

unames = ['user_id', 'gender', 'age', 'occupation', 'zip']
users = pd.read_table('ml-1m/users.dat', sep='::', header=None, names=unames)
# 用python解析会出现警告
print(len(users))

users.head(5)
   user_id gender  age  occupation    zip
0        1      F    1          10  48067
1        2      M   56          16  70072
2        3      M   25          15  55117
3        4      M   45           7  02460
4        5      M   25          20  55455

rating_names = ['user_id', 'movie_id', 'rating', 'timestamp']
ratings = pd.read_table('ml-1m/ratings.dat', sep='::', header=None, names=rating_names)

ratings.head(5)
   user_id  movie_id  rating  timestamp
0        1      1193