电影评分数据集的分析

数据集的获得

进入该网址:https://grouplens.org/datasets/movielens/

找到如下part:
在这里插入图片描述
点击ml-100k.zip进行数据集的下载

在本地解压后,将会看到如下内容:
在这里插入图片描述
但我们目前只需要三个文件,即:
u.data u.item u.user,为便于后续操作,可以找到这三个文件,将其放入新建文件夹。

u.data的内容是评分数据
u.item的内容是电影数据
u.user的内容是观众数据

随意用编辑器打开即可查看。

使用工具

个人使用的是PyCharm Community Edition 2020.3.3

项目流程

创建好新的project后,创建新的python file,需要用到的包是pandas,提前下载好后将其导入;
在这里插入图片描述
首先读取数据
在这里插入图片描述

read_table()的数据参数分别是:

数据文件

一行记录不同列分隔符

第一列是否为行标题

映射关系

由于真实数据设计数据量较大,暂时先读取较少量数据,例如:
在这里插入图片描述
效果展示:

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值