导语
不知道大伙有没有看到过这一句话:“中国(疫苗研发)非常困难,因为在中国我们没有办法做第三期临床试验,因为没有病人了。”这句话是中国工程院院士钟南山在上海科技大学2021届毕业典礼上提出的。这句话在全网流传,被广大网友称之为“凡尔赛”发言。
今天让我们用数据来看看这句话是不是“凡尔赛”本赛。在开始之前我们先来说说今天要用到的python库吧!
1.数据获取部分
requests lxml json openpyxl
2.数据可视化部分
pandas pyecharts(可视化库)
以上的库都可以通过在线下载:
pip instll xx
ps:如果下载速度太慢的话也可以用国内镜像,使用命令,例如:
pip install xx(库名) -i https://pypi.tuna.tsinghua.edu.cn/simple gevent(清华镜像)
现在一起进入今天的代码部分吧!!!
02
数据获取
目标地址:
https://voice.baidu.com/act/newpneumonia/newpneumonia
进入目标地址我们可以看到如下所示:
现在让我们一起去解析网页结构找到我们要爬取到的数据如下所示: