Python数据分析案例二：分析MovieLens 1M数据集

最新推荐文章于 2024-07-06 07:12:39 发布

赛德克1984

最新推荐文章于 2024-07-06 07:12:39 发布

阅读量1.5k

点赞数 1

分类专栏： Python 文章标签：《利用Python进行数据分析·第2版》 Python 数据分析

本文链接：https://blog.csdn.net/qq_41925850/article/details/99449871

版权

该案例基于《利用Python进行数据分析·第2版》，详细介绍了如何读取和联合分析MovieLens数据集，重点使用pivot_table()计算男女群体对电影的平均评分，并找出评分人数超过400的电影。进一步，通过计算评分分差揭示了男性和女性观众在电影喜好上的显著分歧。

摘要由CSDN通过智能技术生成

一：介绍
该案例来自《利用Python进行数据分析·第2版》，主要对三个电影数据集文本进行分析。
二：分析流程
1：读取数据

import pandas as pd
unames = ['user_id', 'gender', 'age', 'occupation', 'zip'] 
users = pd.read_table('C:/Users/17322/Desktop/datasets/movielens/users.dat', sep='::', header=None, names=unames)
rnames = ['user_id', 'movie_id', 'rating',	'timestamp'] 
ratings = pd.read_table('C:/Users/17322/Desktop/datasets/movielens/ratings.dat', sep = '::', header=None, names=rnames) 
mnames = ['movie_id', 'title', 'genres'] 
movies = pd.read_table('C:/Users/17322/Desktop/datasets/movielens/movies.dat',sep='::',header=None,	names=mnames)

查看是否正确读入：

users[:5]

最低0.47元/天解锁文章

赛德克1984

关注

1
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
Python数据分析案例二：分析MovieLens 1M数据集

一：介绍该案例来自《利用Python进行数据分析·第2版》，主要对三个电影数据集文本进行分析。二：分析流程1：读取数据import pandas as pdunames = ['user_id', 'gender', 'age', 'occupation', 'zip'] users = pd.read_table('C:/Users/17322/Desktop/datasets/mo...
复制链接

扫一扫