python电影评分数据分析

本文介绍了使用Python进行电影评分数据分析的过程,包括下载数据、数据解读、数据分析等步骤。通过数据分组,揭示了不同性别和年龄段的评分差异。同时,展示了如何利用透视表进行更深入的探索,如按性别和评分次数对电影评分情况进行分析。
摘要由CSDN通过智能技术生成

今天来试一个数据表连接及数据分析的小应用,步骤如下 :
1、 下载数据
2、 数据解读
3、 数据分析
4、总结

一、 下载数据

下载地址:https://grouplens.org/datasets/movielens/
下载内容:
在这里插入图片描述
在这里插入图片描述

二、 数据解读

1、用户表:
在这里插入图片描述
2、电影表
在这里插入图片描述

3、评分表
在这里插入图片描述

三、 数据分析

首先读入数据,该数据的文件类型与平时我们看到的不一样,但pandas的read_table可直接读取该类文件,方法如下:
【脚本】

ucolName = ['userId', 'age', 'gender', 'occupation', 'zip']
user = pd.read_table(r'D:\cpda\python\ml-100k\u.user', sep='|', header=None, names=ucolName)
print(user.head(2))  #取前2行看一下

【结果】
userId age gender occupation zip
0 1 24 M technician 85711
1 2 53 F other 94043

同理,读取评分文件并赋给变量ratings,表头为:
rColName = [‘userId’, ‘mID’, ‘rating’, ‘time’]
读取电影文件并赋给变量movies,表头为:
mCol

  • 4
    点赞
  • 57
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值