《长津湖》是国庆期间出的一部战争片,相信很多人都去看了。当然它对观众不太友好,主要因为它有三个小时的超长时间,以及真正步入长津湖战役的内容太少。
这次我用爬虫从豆瓣上获取了评价数据:
数据源:豆瓣
数据抓取:requests
数据清洗:lxml(Xpath)
数据可视化:matplotlib
代码如下:
#!/usr/bin/python3
import os
import sys
import subprocess as s
try:
import requests
except:
s.run("python -m pip install requests")
try:
from lxml import etree
except:
s.run("python -m pip install lxml")
try:
import matplotlib
import matplotlib.pyplot as plt
from matplotlib.font_manager import *
except:
s.run("python -m pip install matplotlib")
header = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4