利用python进行数据分析—MovieLens 1M数据集

最新推荐文章于 2024-05-02 10:37:39 发布

Rick_Restart

最新推荐文章于 2024-05-02 10:37:39 发布

阅读量1k

点赞数 1

分类专栏：案例文章标签： python 数据分析

本文链接：https://blog.csdn.net/Rick_Restart/article/details/105567007

版权

该博客介绍了如何使用Python进行数据分析，以MovieLens 1M数据集为例，进行了数据整理，包括数据读取、合并、透视表操作，筛选出评分较高的电影。接着，通过测量评分分歧，展示了女性和男性用户对电影评分的差异，并找出评分差异最大的电影。最后，绘制了电影分类的统计图，揭示了电影标签的分布情况。

摘要由CSDN通过智能技术生成

数据来源：http://www.grouplens.org/node/73

一、导入python库

import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
from matplotlib.font_manager import FontProperties

二、数据整理

1.通过pandas读取数据

pd.options.display.max_rows=10  #分块读取，让展示内容少一点
unames = list(str.split('UserID::Gender::Age::Occupation::Zip-code',"::"))
users = pd.read_table(r'D:\360极速浏览器下载\ml-1m\users.dat', sep='::', header=None, names=unames)

rnames = list(str.split('UserID::MovieID::Rating::Timestamp','::'))
ratings=pd.read_table(r'D:\360极速浏览器下载\ml-1m\ratings.dat',sep='::',header=None, names=rnames)

mnames

最低0.47元/天解锁文章

Rick_Restart

关注

1
点赞
踩
12

收藏

觉得还不错? 一键收藏
1
评论
利用python进行数据分析—MovieLens 1M数据集

数据来源：http://www.grouplens.org/node/73一、导入python库import pandas as pdimport numpy as npfrom matplotlib import pyplot as pltfrom matplotlib.font_manager import FontProperties二、数据整理1.通过pandas读取数据...
复制链接

扫一扫