python做疫情数据分析的框架_Python制作新冠疫情世界地图

目录

pyecharts模块

简介

Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 诞生了

如果想要掌握pyecharts,可以阅读 pyecharts中文文档 ,里面的图表类型和配置项写的非常详细,我就不过多的赘述了

安装pyecharts

安装的命令也非常简单:

pip install pyecharts

安装成功:

测试pyecharts模块

我们可以尝试运行官方文档所给出的几个小例子来测试一下pyecharts模块是否成功安装

打开编辑器,输入并运行以下代码:

from pyecharts.charts import Bar

from pyecharts import options as opts

# 内置主题类型可查看 pyecharts.globals.ThemeType

from pyecharts.globals import ThemeType

bar = (

Bar(init_opts=opts.InitOpts(theme=ThemeType.LIGHT))

.add_xaxis(["衬衫", "羊毛衫", "雪纺衫", "裤子", "高跟鞋", "袜子"])

.add_yaxis("商家A", [5, 20, 36, 10, 75, 90])

.add_yaxis("商家B", [15, 6, 45, 20, 35, 66])

.set_global_opts(title_opts=opts.TitleOpts(title="主标题", subtitle="副标题"))

)

bar.render() #保存为html文件

若此时在当前目录下生成了一个名为render.html的文件

打开此文件,看到如下的图片则证明安装模块成功

pyecharts实战:绘制新冠肺炎疫情地图

需求分析

想要制作全球疫情的地图(空气质量图,人口分布图也是同理),首先需要的就是每个国家的疫情数据,比如人数,治愈数,增长数...... 那么我们该如何获取到这些信息呢?

请求数据

我们发现很多app和网页上都会有最新的疫情信息公布,我选取的数据来源是腾讯地图。

首先打开 腾讯地图的疫情信息页 ,可以发现疫情的信息展现在这一页中

获取这些信息的方法有很多种,可以是用表达式提取,也可以抓包分析,我更喜欢的一种方法是抓包分析。

右击《检查》,点击《network》选项卡并刷新界面,看到加载出来很多数据包,找到里面最像列表的一个list数据包

此时发现,这个list数据包正式我们要提取的数据列表,里面的每个键值对都代表着相应的数据,提取到这些键值对就可以获取到所有的数据信息了,再次回到headers,选项卡下面对应的网址就是我们即将请求的网址,这里我们需要注意的是,这个网址对应的请求是post而不是我们经常使用的get

向网页请求数据:

import requests

url = 'https://api.inews.qq.com/newsqa/v1/automation/foreign/country/ranklist'

response = requests.post(url).text

print(response)

可以看到这个网页并没有设置反爬虫,可以轻松的获取到数据

提取数据

我们刚刚请求到的数据格式是字符格式,并不能被我们直接提取到,必须想将字符格式的数据转换为字典格式才可以开始下一步的提取

resp = json.loads(response) #使用变量resp来接收字典格式的数据

将变量转化为字典格式后,就要开始提取数据了 提取json类型的数据可以使用取出列表元素的方法来提取,即先遍历列表将每个国家的信息提取出来,再分别从这些条信息中提取到我们想要的数据

提取数据:

import json

resp = json.loads(response) #使用变量resp来接收字典格式的数据

for data in resp['data']: #遍历提取每个国家的疫情数据

name = data['name'] #国家名

confirm = data['confirm'] #该国家疫情人数

print(name,confirm)

打印数据:

处理数据

在得到了国家和人数信息之后,还需要将数据存储到字典中才能传入图表中,这就需要我们手动的转换数据,并储存到字典中

map_version = {} #定义空字典

for data in resp['data']: #遍历提取每个国家的疫情数据

name = data['name'] #国家名

confirm = data['confirm'] #该国家疫情人数

map_version[name] = int(confirm) #将国家和人数以键值对的形式传入字典

输出字典:

此时打印出来的字典是标准的字典格式,但是这种格式并不是pyecharts所要求的格式,所以还需要一行代码来进行转换

element = list(map_version.items())

然后就可以输出传入数据的标准格式:

制作可视化地图

在将数据爬取、变换、整理后,所有准备工作都已经做完,下面我们来调用数据实现数据可视化

先写出一个初步的框架来接收内容

from pyecharts.charts import Map,Geo

map = Map().add(series_name="世界疫情分布图", #名称

data_pair=element, #传入数据

maptype='world', #地图类型

)

map.render('map.html') #命名并保存

运行代码,发现当前文件夹下出现了一个map.html文件,双击运行

看到这个图表之后,发现代码的运行并没有问题,但是数据却没有传到地图中,这是由于pyecharts默认的世界地图中的国家名是英文,所以我们就要传入一个字典来替代掉这些英文

设置可视化地图

生成了地图之后,接下来就是要保证地图的正确性和美观,所以我们要来设置世界地图

地图上显示国家名太多,影响可读性,所以设置为不显示国家名

from pyecharts import options

map.set_series_opts(label_opts=options.LabelOpts(is_show=False)) #不显示国家名

按照感染人数的不同,给地图添加不同的颜色

#设置全局配置项

map.set_global_opts(visualmap_opts=options.VisualMapOpts(max_=1100000,is_piecewise=True,pieces=[

{"min": 500000},

{"min": 200000, "max": 499999},

{"min": 100000, "max": 199999},

{"min": 50000, "max": 99999},

{"min": 10000, "max": 49999},

{"max": 9999},]))

代表国家首都的圆点不美观,去掉红点:

map = Map().add(

is_map_symbol_show=False, #不显示标记

)

设置背景颜色并为网页取名:

map = Map(options.InitOpts(bg_color="#87CEFA",page_title='世界疫情分布')).add()

到了现在所有的配置已经完成,但是图表要想显示数据还需要传入一个字典来替换掉默认的英文名,具体实现请看下面的完整代码。

完整代码

import requests

import json

from pyecharts.charts import Map

from pyecharts import options

url = 'https://api.inews.qq.com/newsqa/v1/automation/foreign/country/ranklist'

response = requests.post(url).text

resp = json.loads(response) #使用变量resp来接收字典格式的数据

map_version = {} #定义空字典

for data in resp['data']: #遍历提取每个国家的疫情数据

name = data['name'] #国家名

confirm = data['confirm'] #该国家疫情人数

map_version[name] = int(confirm) #将国家和人数以键值对的形式传入字典

element = list(map_version.items()) #将字典值调整为可以传入地图的格式

name_map = {

'Singapore Rep.': '新加坡',

'Dominican Rep.': '多米尼加',

'Palestine': '巴勒斯坦',

'Bahamas': '巴哈马',

'Timor-Leste': '东帝汶',

'Afghanistan': '阿富汗',

'Guinea-Bissau': '几内亚比绍',

"Côte d'Ivoire": '科特迪瓦',

'Siachen Glacier': '锡亚琴冰川',

"Br. Indian Ocean Ter.": '英属印度洋领土',

'Angola': '安哥拉',

'Albania': '阿尔巴尼亚',

'United Arab Emirates': '阿联酋',

'Argentina': '阿根廷',

'Armenia': '亚美尼亚',

'French Southern and Antarctic Lands': '法属南半球和南极领地',

'Australia': '澳大利亚',

'Austria': '奥地利',

'Azerbaijan': '阿塞拜疆',

'Burundi': '布隆迪',

'Belgium': '比利时',

'Benin': '贝宁',

'Burkina Faso': '布基纳法索',

'Bangladesh': '孟加拉国',

'Bulgaria': '保加利亚',

'The Bahamas': '巴哈马',

'Bosnia and Herz.': '波斯尼亚和黑塞哥维那',

'Belarus': '白俄罗斯',

'Belize': '伯利兹',

'Bermuda': '百慕大',

'Bolivia': '玻利维亚',

'Brazil': '巴西',

'Brunei': '文莱',

'Bhutan': '不丹',

'Botswana': '博茨瓦纳',

'Central African Rep.': '中非',

'Canada': '加拿大',

'Switzerland': '瑞士',

'Chile': '智利',

'China': '中国',

'Ivory Coast': '象牙海岸',

'Cameroon': '喀麦隆',

'Dem. Rep. Congo': '刚果民主共和国',

'Congo': '刚果',

'Colombia': '哥伦比亚',

'Costa Rica': '哥斯达黎加',

'Cuba': '古巴',

'N. Cyprus': '北塞浦路斯',

'Cyprus': '塞浦路斯',

'Czech Rep.': '捷克',

'Germany': '德国',

'Djibouti': '吉布提',

'Denmark': '丹麦',

'Algeria': '阿尔及利亚',

'Ecuador': '厄瓜多尔',

'Egypt': '埃及',

'Eritrea': '厄立特里亚',

'Spain': '西班牙',

'Estonia': '爱沙尼亚',

'Ethiopia': '埃塞俄比亚',

'Finland': '芬兰',

'Fiji': '斐',

'Falkland Islands': '福克兰群岛',

'France': '法国',

'Gabon': '加蓬',

'United Kingdom': '英国',

'Georgia': '格鲁吉亚',

'Ghana': '加纳',

'Guinea': '几内亚',

'Gambia': '冈比亚',

'Guinea Bissau': '几内亚比绍',

'Eq. Guinea': '赤道几内亚',

'Greece': '希腊',

'Greenland': '格陵兰',

'Guatemala': '危地马拉',

'French Guiana': '法属圭亚那',

'Guyana': '圭亚那',

'Honduras': '洪都拉斯',

'Croatia': '克罗地亚',

'Haiti': '海地',

'Hungary': '匈牙利',

'Indonesia': '印度尼西亚',

'India': '印度',

'Ireland': '爱尔兰',

'Iran': '伊朗',

'Iraq': '伊拉克',

'Iceland': '冰岛',

'Israel': '以色列',

'Italy': '意大利',

'Jamaica': '牙买加',

'Jordan': '约旦',

'Japan': '日本',

'Kazakhstan': '哈萨克斯坦',

'Kenya': '肯尼亚',

'Kyrgyzstan': '吉尔吉斯斯坦',

'Cambodia': '柬埔寨',

'Korea': '韩国',

'Kosovo': '科索沃',

'Kuwait': '科威特',

'Lao PDR': '老挝',

'Lebanon': '黎巴嫩',

'Liberia': '利比里亚',

'Libya': '利比亚',

'Sri Lanka': '斯里兰卡',

'Lesotho': '莱索托',

'Lithuania': '立陶宛',

'Luxembourg': '卢森堡',

'Latvia': '拉脱维亚',

'Morocco': '摩洛哥',

'Moldova': '摩尔多瓦',

'Madagascar': '马达加斯加',

'Mexico': '墨西哥',

'Macedonia': '马其顿',

'Mali': '马里',

'Myanmar': '缅甸',

'Montenegro': '黑山',

'Mongolia': '蒙古',

'Mozambique': '莫桑比克',

'Mauritania': '毛里塔尼亚',

'Malawi': '马拉维',

'Malaysia': '马来西亚',

'Namibia': '纳米比亚',

'New Caledonia': '新喀里多尼亚',

'Niger': '尼日尔',

'Nigeria': '尼日利亚',

'Nicaragua': '尼加拉瓜',

'Netherlands': '荷兰',

'Norway': '挪威',

'Nepal': '尼泊尔',

'New Zealand': '新西兰',

'Oman': '阿曼',

'Pakistan': '巴基斯坦',

'Panama': '巴拿马',

'Peru': '秘鲁',

'Philippines': '菲律宾',

'Papua New Guinea': '巴布亚新几内亚',

'Poland': '波兰',

'Puerto Rico': '波多黎各',

'Dem. Rep. Korea': '朝鲜',

'Portugal': '葡萄牙',

'Paraguay': '巴拉圭',

'Qatar': '卡塔尔',

'Romania': '罗马尼亚',

'Russia': '俄罗斯',

'Rwanda': '卢旺达',

'W. Sahara': '西撒哈拉',

'Saudi Arabia': '沙特阿拉伯',

'Sudan': '苏丹',

'S. Sudan': '南苏丹',

'Senegal': '塞内加尔',

'Solomon Is.': '所罗门群岛',

'Sierra Leone': '塞拉利昂',

'El Salvador': '萨尔瓦多',

'Somaliland': '索马里兰',

'Somalia': '索马里',

'Serbia': '塞尔维亚',

'Suriname': '苏里南',

'Slovakia': '斯洛伐克',

'Slovenia': '斯洛文尼亚',

'Sweden': '瑞典',

'Swaziland': '斯威士兰',

'Syria': '叙利亚',

'Chad': '乍得',

'Togo': '多哥',

'Thailand': '泰国',

'Tajikistan': '塔吉克斯坦',

'Turkmenistan': '土库曼斯坦',

'East Timor': '东帝汶',

'Trinidad and Tobago': '特里尼达和多巴哥',

'Tunisia': '突尼斯',

'Turkey': '土耳其',

'Tanzania': '坦桑尼亚',

'Uganda': '乌干达',

'Ukraine': '乌克兰',

'Uruguay': '乌拉圭',

'United States': '美国',

'Uzbekistan': '乌兹别克斯坦',

'Venezuela': '委内瑞拉',

'Vietnam': '越南',

'Vanuatu': '瓦努阿图',

'West Bank': '西岸',

'Yemen': '也门',

'South Africa': '南非',

'Zambia': '赞比亚',

'Zimbabwe': '津巴布韦',

'Comoros': '科摩罗'

}

map = Map(options.InitOpts(bg_color="#87CEFA",page_title='世界疫情分布')).\

add(series_name="世界疫情分布图", #名称

data_pair=element, #传入数据

is_map_symbol_show=False, #不显示标记

maptype='world', #地图类型

name_map=name_map,

)

#设置全局配置项

map.set_global_opts(visualmap_opts=options.VisualMapOpts(max_=1100000,is_piecewise=True,pieces=[

{"min": 500000},

{"min": 200000, "max": 499999},

{"min": 100000, "max": 199999},

{"min": 50000, "max": 99999},

{"min": 10000, "max": 49999},

{"max": 9999},]))

#设置系列配置项

map.set_series_opts(label_opts=options.LabelOpts(is_show=False)) #不显示国家名

map.render('map.html') #命名并保存

实现结果

这个结果可以动态的显示在网页中,可以根据人数来筛选地图的板块,而且方便缩放

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值