数据可视化是数据分析中重要的部分,今天这篇博客将介绍如何使用pycharts包生成简单的折现图,新手入门。
一、json数据介绍
json本质上是一种带有特定格式的字符串,按照一定的格式去组织和封装数据,使得数据可以在不同的编程语言中流通。
json就像国际通用语言英语,不同的国家的人可以通过英语交流。
通过处理json数据,使用pycharts包工具就可以轻松生成一个折线图。
二、数据准备
本篇博客准备处理关于新冠疫情的相关数据
数据可以在百度网盘获取:
https://pan.baidu.com/s/1J4NJpjEP82VlaDrroWLOzA?pwd=98c4
打开数据可以发现一堆数据,难以看懂
这时我们就需要json解释器才能清晰的看懂这些数据,但在复制我们的数据前,需要删掉文本无关的信息
在百度上随便找一个json解释器,删掉上述无关文本后复制到解释器中,可以得到清晰的视图
其他的两份数据也这样整理好就可以了
三、生成折线图
1.导入json包和pycharts包
import json
from pyecharts.charts import Line
2.处理数据
#读取数据
us_f = open("D:\\BaiduNetdiskDownload\资料\可视化案例数据\折线图数据\美国.txt",'r',encoding="UTF-8")
us_data = us_f.read()
#去掉不规范的开头结尾
us_data = us_data.replace('jsonp_1629344292311_69436(','')
us_data = us_data[:-2]
#将json数据转为python字典
us_dict = json.loads(us_data)
json.loads()函数是将json文件转化为python的字典,这样python的解释器才能认得这些数据,我们也才能取得里面的数据并处理
3.生成折线图
x,y轴的数据分别是日期、确诊人数,我们通过json解释器中发现日期在字典的哪个嵌套部分并且用下标来表示它
#获取x,y轴的数据
x_data = us_dict['data'][0]['trend']['updateDate'][:314]
us_y_data = us_dict['data'][0]['trend']['list'][0]['data'][:314]
#生成图表
line = Line()
line.add_xaxis(x_data)
line.add_yaxis("美国确诊人数",us_y_data,label_opts=LabelOpts(is_show=False))
line.render()
#关闭文件
us_f.close()
重复上面的步骤生成其他两个国家,就可以得到折现统计图了