3月8日妇女节,我很期待的超级英雄电影《惊奇队长》上映了,票房表现很快过亿,但大众口碑却让人失望。
一个有趣且常见的现象是,隔壁获奖无数,口碑爆炸的《绿皮书》,票房却远远不如《惊奇队长》。
众所周知,中国市场是一个票房和口碑并不真正匹配的市场。因此,我决定从票房数据上看一看那些年中国市场电影的表现。
*本教程面向python及数据零基础爱好者,文末分享免费教程及资料福利。
#数据爬取:中国电影票房
我们选取某票房数据网站“单周票房数据”进行数据收集:
但该网站是一个动态网址,页面上只显示了近几周的票房数据。
只有这么几周的数据当然不符合我的研究需求。我尝试使用使用fiddler进行抓包后,开心地发现了该网站的json数据及其真实网址:
fiddler是常用的网页抓包工具,它能够记录并检查所有你的电脑和互联网之间的http通讯,设置断点,查看所有的进出”Fiddler的cookie,html,js,css等文件