目录
01-折线图可视化-案例:2020年美印日疫情确诊人数折线图
01-折线图可视化-案例:2020年美印日疫情确诊人数折线图
1-数据来源以及使用技术
2-了解json数据格式
3-pyecharts模块(框架)入门
1-全局配置
2-数据处理
# 2020年美印日新冠确诊人数折线图
import json
from pyecharts.charts import Line
from pyecharts.options import TitleOpts, LabelOpts
f_us = open("C:\\Users\\lihanting\\Desktop\\Data\\美国.txt", "r", encoding='UTF-8')
us_data = f_us.read() # 读到文件全部内容
# 去除开头和结尾不符合json格式的文本
us_data = us_data.replace("jsonp_1629344292311_69436(", "")
us_data = us_data[:-2]
# 把处理后符合json格式的数据转换成字典
us_dict = json.loads(us_data)
# 获取trend key 是个字典
# trend:{'updateDate':[],'list':[{'name':'确诊', 'data':[]},{},{}]}
us_trend_data = us_dict['data'][0]['trend']
# 拿到日期数据和确诊人数数据构建y和x轴
us_x_data = us_trend_data['updateDate'][:314]
us_y_data = us_trend_data['list'][0]['data'][:314]
# 生成图表
line = Line()
line.add_xaxis(us_x_data) # x轴共用 所以只需要添加一个国家的日期数据就可以
line.add_yaxis("美国确诊人数", us_y_data, label_opts=LabelOpts(is_show=False))
# 设置全局选项
line.set_global_opts(
title_opts=TitleOpts(title="2020年美日印三国确诊人数对比折线图", pos_left="center", pos_bottom="1%")
)
line.render()
f_us.close()
02-地图可视化-案例:全国疫情地图
1-数据结构
2-代码以及展示
from pyecharts.charts import Map
from pyecharts.options import VisualMapOpts
import json
# 读取数据文件
f = open("C:\\Users\\lihanting\\Desktop\\Data\\疫情.txt", encoding='UTF-8')
data = f.read()
# 关闭文件
f.close()
# json转换成字典
data_dict = json.loads(data)
'''
取到各省数据
province_data_list列表中存放的是字典{'name': , 'today': {}, 'total': {}}
'''
province_data_list = data_dict['areaTree'][0]['children']
# 组装每个省份和确诊人数为元组,并将各个省份的数据都封装入列表 以便作为参数
data_list = [] # 绘图需要的列表
for province_data in province_data_list:
province_name = province_data['name']
province_confirm = province_data['total']['confirm']
data_list.append((province_name, province_confirm))
# 创建地图对象
map = Map()
map.add("全国疫情地图", data_list, "china")
# 设置全局选项
map.set_global_opts(
visualmap_opts=VisualMapOpts(
is_show=True, # 视图应映射是否显示
is_piecewise=True, # 是否分段
pieces=(
{"min": 1, "max": 9, "Label": 1 - 9, "color": "#CCFFFF"},
{"min": 100, "max": 999, "Label": 100 - 999, "color": "#FFFF99"},
{"min": 1000, "max": 4999, "Label": 1000 - 4999, "color": "#FF9966"},
{"min": 5000, "max": 9999, "Label": 5000 - 9999, "color": "#FF6666"},
{"min": 10000, "max": 99999, "Label": 10000 - 99999, "color": "#CC3333"},
{"min": 100000, "Label": "100000+", "color": "#990033"},
)
)
)
# 绘图
map.render("全国疫情地图.html")
03-动态柱状图-案例:GDP动态柱状图绘制
1-基础柱状图
2-时间线
3-GDP动态图代码及效果图
1-拓展:列表的sort方法
2-需求分析
3-数据处理
4-代码及效果
# GDP动态柱状图
from pyecharts.charts import Bar
from pyecharts.options import *
from pyecharts.charts import Timeline
from pyecharts.globals import ThemeType
# 读取数据
f = open("C:\\Users\\lihanting\\Desktop\\Data\\1960-2019全球GDP数据.csv", encoding="GB2312")
data_lines = f.readlines()
# 关闭文件
f.close()
# 删除第一条数据
data_lines.pop(0)
# 将数据转换为字典存储 格式为
# {年份:[[国家,gdp], [], []], 年份:[[国家, gdp][][]]}
data_dict = {}
for line in data_lines:
year = int(line.split(",")[0])
country = line.split(",")[1]
gdp = float(line.split(",")[2])
# 如何判断字典里有没有指定的key
try:
data_dict[year].append([country, gdp])
except KeyError:
data_dict[year] = []
data_dict[year].append([country, gdp])
'''
# 排序年份(字典内年份没有顺序,每个时间结点都是一个bar,bar是根据每个年份构建的)
# for循环每一年的数据,基于每一年的bar对象
# 在for中将每一年的bar对象添加到时间线中
'''
sorted_year_list = sorted(data_dict.keys())
timeline = Timeline({"theme": ThemeType.LIGHT})
for year in data_dict:
data_dict[year].sort(key=lambda element: element[1], reverse=True) # 从小到大排 需要反转一下才是前八
# 取出每年gdp前8的国家
year_data = data_dict[year][0:8]
x_data = []
y_data = []
for country_gdp in year_data:
x_data.append(country_gdp[0])
y_data.append(country_gdp[1])
# 构建柱状图
x_data.reverse() # 因为取了gdp前八的国家,添加到x轴是从下向上,我们希望gdp大的在上所以这里反转 但是gdp数据也同步反转
y_data.reverse()
bar = Bar()
bar.add_xaxis(x_data)
bar.add_yaxis("GDP(亿)", y_data, label_opts=LabelOpts(position="right"))
bar.reversal_axis()
# 设置全局配置 标题
bar.set_global_opts(
title_opts=TitleOpts(title=f"{year}年全球GDP前八")
)
# 添加到时间点里
timeline.add(bar, str(year))
# 设置时间线自动播放
timeline.add_schema(
play_interval=500,
is_timeline_show=True,
is_auto_play=True,
is_loop_play=False # 是否循环播放
)
# 绘图
timeline.render("1960-2019全球GDP变化柱状图.html")