python-MovieLen数据集

最新推荐文章于 2023-07-12 20:46:35 发布

qq_40516413

最新推荐文章于 2023-07-12 20:46:35 发布

阅读量777

点赞数

本文链接：https://blog.csdn.net/qq_40516413/article/details/83108170

版权

本文通过Python读取并合并MovieLens数据集的users、ratings和movies三部分数据，然后进行数据预处理，计算每部电影按性别平均得分、女性观众最喜欢的电影、男女分歧最大的电影以及评分数据标准差最高的电影。

摘要由CSDN通过智能技术生成

# -*- coding: utf-8 -*-
"""
Created on Tue Oct 16 17:12:28 2018

@author: fengjuan
"""
import pandas as pd
#将各个表分别读到pandas Dataframe中
unames=['user_id','gender','age','occupation','zip']
users=pd.read_table('E:/python/ml-1m/users.dat',sep='::',header=None,names=unames)
rnames=['user_id','movie_id','rating','names=rnames']
ratings=pd.read_table('E:/python/ml-1m/ratings.dat',sep='::',header=None,names=rnames)

mnames=['movie_id','title','genres']
movies=pd.read_table('E:/python/ml-1m/movies.dat',sep='::',header=None,names=mnames)
print(users[:5])
'''结果：
#print(users[:5])
user_id gender age occupation zip
0 1 F 1 10 48067
1 2 M 56 16 70072
2 3 M 25 15 55117
3 4 M 45 7 02460
4 5 M 25 20 55455
user_id movie_id rating names=rnames
0 1 1193 5 978300760
1 1 661 3 978302109
2 1 914 3 978301968
3 1 3408 4 978300275
4 1 2355 5 978824291'''
print(ratings[:5])
'''结果：
user_id movie_id rating names=rnames
0 1 1193 5 978300760
1 1 661 3 978302109
2 1 914 3 978301968
3 1 3408 4 978300275
4 1 2355 5 978824291'''

print(movies[:5])
'''结果
movie_id ...

最低0.47元/天解锁文章

qq_40516413

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python-MovieLen数据集

# -*- coding: utf-8 -*-"""Created on Tue Oct 16 17:12:28 2018@author: fengjuan"""import pandas as pd#将各个表分别读到pandas Dataframe中unames=['user_id','gender','age','occupation','zip']users=pd.read...
复制链接

扫一扫