不知不觉疫情已经快要才出现三年了,对于疫情管控,我国有一系列良好的措施。下面我们通过python对疫情数据进行一个简单的爬取整理以及可视化。
#导入模块
import pandas as pd
import requests
#首先这是爬取数据和整理数据我们需要用到的第三方库,疫情数据来自腾讯新闻#实时更新:新冠肺炎疫情最新动态https://news.qq.com/zt2020/page/feiyan.htm#/
https://api.inews.qq.com/newsqa/v1/query/inner/publish/modules/listmodules=localCityNCOVDataList,diseaseh5Shelf
#这里已经通过抓包工具获取了所需数据(国内疫情数据)链接,可以直接复制使用的
url='https://api.inews.qq.com/newsqa/v1/query/inner/publish/modules/listmodules=localCityNCOVDataList,diseaseh5Shelf'
#模拟浏览器发送请求并接收响应
resp = requests.get(url)
#json类型转换,并获取data数据
json_data = resp.json()['data']
#json_data #查看此时数据
#数据已经爬出来了,我们需要把有用的数据提取出出来,首先要做的就是新建一个列表啦,把提取的数据都存入列表最后转化为dataframe格式,保存为csv文件就可以轻松查看每天疫情实时数据了
china_data = json_data['diseaseh5Shelf']['areaTree'][0]['children']
data_set = []
#提取每个省份的数据
for i in china_data:
#空字典
data_dict = {}
#省份名称
data_dict['province'] = i['name']
#新增确诊
data_dict['nowConfirm'] = i['total']['nowConfirm']
#累计确诊
data_dict['confirm'] = i['total']['confirm']
#死亡人数
data_dict['dead'] = i['total']['dead']
#治愈人数
data_dict['heal'] = i['total']['heal']
#添加字典进空列表
data_set.append(data_dict)
#转化为dataframe格式
df = pd.DataFrame(data_set)
df #查看此时表格数据
#保存数据为csv格式,编码用gbk
df.to_csv('疫情数据.csv', encoding='gbk')