十年电影票房数据爬取与分析 | 免费数据教程

3月8日妇女节,我很期待的超级英雄电影《惊奇队长》上映了,票房表现很快过亿,但大众口碑却让人失望。

一个有趣且常见的现象是,隔壁获奖无数,口碑爆炸的《绿皮书》,票房却远远不如《惊奇队长》。

众所周知,中国市场是一个票房和口碑并不真正匹配的市场。因此,我决定从票房数据上看一看那些年中国市场电影的表现。

*本教程面向python及数据零基础爱好者,文末分享免费教程及资料福利。

#数据爬取:中国电影票房

我们选取某票房数据网站“单周票房数据”进行数据收集:
url:http://www.cbooo.cn/movieday

但该网站是一个动态网址,页面上只显示了近几周的票房数据。

只有这么几周的数据当然不符合我的研究需求。我尝试使用使用fiddler进行抓包后,开心地发现了该网站的json数据及其真实网址:

fiddler是常用的网页抓包工具,它能够记录并检查所有你的电脑和互联网之间的http通讯,设置断点,查看所有的进出”Fiddler的cookie,html,js,css等文件࿰

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值