2019年除夕夜的到来已经进入倒计时,在这家庭团圆的时刻,除了全家一起看春节联欢晚会外,一起去电影院看部电影也是极好的选择。每年的贺岁档也是各大影片相互角逐、吸金的重要时刻,很多影片提前几个月就开始宣传,而对贺岁片的吐槽也为过年增添不少气氛。
十年,对于任何人来说都是一个巨大的变化。十年的电影无论题材、拍摄技术和资金都发生了很大的变化,所以找了一下近十年来的电影票房数据,用数据来分析一下电影十年来的变化。
数据爬取
在中国票房网站上提供了近十年来各大电影的票房数据信息,包括影片名、影片类型、票房、上座率、国家以及上映日期,我们爬取十年来每年票房前25的影片数据,这些优质影片可以称得上是每年电影市场的代表。
数据信息:
完整代码:
import requests
from bs4 import BeautifulSoup
import xlwt
def pachong(url,c):
res = requests.get(url)
res.encoding = "utf-8"
soup = BeautifulSoup(res.text,"lxml")
html = soup.select(".date > tr > td")
for i in range(25):
worksheet.write(i+25*c, 0, label = html[0+