任务:完成数据可视化折线图的开发
数据来源:《百度疫情实时大数据报告》
使用技术:echarts是个由百度开发的数据可视化框架,echarts提供的python语言的第三方包pyecharts
一、json数据格式的转换
1. json是一种轻量级的数据交互格式,采用完全独立于编程语言的文本格式来存储和表示数据(就是字符串),python语言使用json有很大优势,因为json无非就是一个单独的字典或一个内部元素都十是字典的列表,所以json可以直接和python的字典或列表进行无缝转换。
2. json格式数据转化
通过json.dumps(data)把python数据转化为了json数据
通过json.loads(data)把json数据转化为了python列表或字典
data = json.dumps(data)
data = json.loads(data)
二、pyecharts模块介绍
1. 开发可视化体表使用的技术栈是:
echarts框架的python版本:pyecharts包
2. 如何安装pyecharts包
方法一:pip intsall pyecharts
方法二:直接在python里面安装
3. 如何查看官方示例
打开官方画廊https://gallery.pyecharts org/#/README
三、pyecharts的入门使用
1. pyecharts模块中有很多的配置选项,常用到的三个类别的选项:
- 全局配置项
- 系列配置项
2. 全局配置项能做什么?
- 配置图表的标题
- 配置图例
- 配置鼠标移动效果
- 配置工具栏
- 等整体配置项
上代码:
#导包
from pyecharts.charts import Line
from pyecharts.options import TitleOpts, LegendOpts, ToolboxOpts, VisualMapOpts
#创建一个折线图对象
line = Line()
#给折线图对象添加x轴的数据
line.add_xaxis(["中国","美国","英国"])
#给折线图对象添加y轴的数据
line.add_yaxis("GDP",[30,20,10])
#设置全局配置项set_global_opts来设置
line.set_global_opts(
title_opts=TitleOpts(title="GDP展示", pos_left="center", pos_bottom="1%"),
legend_opts=LegendOpts(is_show=True),
toolbox_opts=ToolboxOpts(is_show=True),
visualmap_opts=VisualMapOpts(is_show=True),
)
#通过render方法,将代码生成为图像
line.render()
运行结果如下:
四、数据处理
使用第三方网站ab173.com将json数据进行格式化分析,更容易看出层级关系
五、创建折线图
代码如下:
#导包
import json
from pyecharts.charts import Line
from pyecharts.options import TitleOpts, LabelOpts
#处理数据
f_us = open("D:/美国.txt", "r", encoding="UTF-8")
us_data = f_us.read() #美国的全部内容
f_jp = open("D:/日本.txt", "r", encoding="UTF-8")
jp_data = f_jp.read() #日本的全部内容
f_in = open("D:/印度.txt", "r", encoding="UTF-8")
in_data = f_in.read() #印度的全部内容
#去掉不合json规范的开头
us_data = us_data.replace("jsonp_1629344292311_69436(", "")
jp_data = jp_data.replace("jsonp_1629350871167_29498(", "")
in_data = in_data.replace("jsonp_1629350745930_63180(", "")
#去掉不合json规范的结尾
us_data = us_data[:-2]
jp_data = jp_data[:-2]
in_data = in_data[:-2]
#JSON转Python字典
us_dict = json.loads(us_data)
jp_dict = json.loads(jp_data)
in_dict = json.loads(in_data)
#获取trend key
us_trend_data = us_dict['data'][0]['trend']
jp_trend_data = jp_dict['data'][0]['trend']
in_trend_data = in_dict['data'][0]['trend']
#获取日期数据,用于x轴,取2020年(到下标314结束)
us_x_data = us_trend_data['updateDate'][:314]
jp_x_data = jp_trend_data['updateDate'][:314]
in_x_data = in_trend_data['updateDate'][:314]
#获取日期数据,用于y轴,取2020年(到下标314结束)
us_y_data = us_trend_data['list'][0]['data'][:314]
jp_y_data = jp_trend_data['list'][0]['data'][:314]
in_y_data = in_trend_data['list'][0]['data'][:314]
#生成图表
line = Line() #构建折线图对象
#添加x轴数据
line.add_xaxis(us_x_data)
#添加y轴数据
line.add_yaxis("美国确诊人数", us_y_data, label_opts=LabelOpts(is_show=False)) #添加美国y轴数据
line.add_yaxis("日本确诊人数", jp_y_data, label_opts=LabelOpts(is_show=False)) #添加日本y轴数据
line.add_yaxis("印度确诊人数", in_y_data, label_opts=LabelOpts(is_show=False)) #添加印度y轴数据
#生成全局选项
line.set_global_opts(
#标题设置
title_opts=TitleOpts(title="2020年美日印三国确诊人数对比折线图", pos_left="center", pos_bottom="1%")
)
#使用render方法,生成图表
line.render()
#关闭文件对象
f_us.close()
f_jp.close()
f_in.close()
生成折线图如下: