Python数据可视化

tenezzi

已于 2024-12-25 13:51:54 修改

阅读量1k

点赞数

分类专栏： Python 文章标签： python 开发语言 json

于 2022-11-18 17:41:24 首次发布

本文链接：https://blog.csdn.net/Tting_12/article/details/127861930

版权

Python 专栏收录该内容

3 篇文章

订阅专栏

01-折线图可视化-案例：2020年美印日疫情确诊人数折线图

03-动态柱状图-案例：GDP动态柱状图绘制

01-折线图可视化-案例：2020年美印日疫情确诊人数折线图

1-数据来源以及使用技术

2-了解json数据格式

3-pyecharts模块（框架）入门

1-全局配置

2-数据处理

# 2020年美印日新冠确诊人数折线图
import json
from pyecharts.charts import Line
from pyecharts.options import TitleOpts, LabelOpts
f_us = open("C:\\Users\\lihanting\\Desktop\\Data\\美国.txt", "r", encoding='UTF-8')
us_data = f_us.read()  # 读到文件全部内容
# 去除开头和结尾不符合json格式的文本
us_data = us_data.replace("jsonp_1629344292311_69436(", "")
us_data = us_data[:-2]
# 把处理后符合json格式的数据转换成字典
us_dict = json.loads(us_data)
# 获取trend key 是个字典
# trend:{'updateDate':[],'list':[{'name':'确诊', 'data':[]},{},{}]}
us_trend_data = us_dict['data'][0]['trend']
# 拿到日期数据和确诊人数数据构建y和x轴
us_x_data = us_trend_data['updateDate'][:314]
us_y_data = us_trend_data['list'][0]['data'][:314]
# 生成图表
line = Line()
line.add_xaxis(us_x_data)  # x轴共用 所以只需要添加一个国家的日期数据就可以
line.add_yaxis("美国确诊人数", us_y_data, label_opts=LabelOpts(is_show=False))
# 设置全局选项
line.set_global_opts(
    title_opts=TitleOpts(title="2020年美日印三国确诊人数对比折线图", pos_left="center", pos_bottom="1%")
)
line.render()
f_us.close()

02-地图可视化-案例：全国疫情地图

1-数据结构

2-代码以及展示

from pyecharts.charts import Map
from pyecharts.options import VisualMapOpts
import json
# 读取数据文件
f = open("C:\\Users\\lihanting\\Desktop\\Data\\疫情.txt", encoding='UTF-8')
data = f.read()
# 关闭文件
f.close()
# json转换成字典
data_dict = json.loads(data)
'''
取到各省数据
province_data_list列表中存放的是字典{'name': , 'today': {}, 'total': {}}
'''
province_data_list = data_dict['areaTree'][0]['children']
# 组装每个省份和确诊人数为元组，并将各个省份的数据都封装入列表 以便作为参数
data_list = []  # 绘图需要的列表
for province_data in province_data_list:
    province_name = province_data['name']
    province_confirm = province_data['total']['confirm']
    data_list.append((province_name, province_confirm))
# 创建地图对象
map = Map()
map.add("全国疫情地图", data_list, "china")
# 设置全局选项
map.set_global_opts(
    visualmap_opts=VisualMapOpts(
        is_show=True,  # 视图应映射是否显示
        is_piecewise=True,  # 是否分段
        pieces=(
            {"min": 1, "max": 9, "Label": 1 - 9, "color": "#CCFFFF"},
            {"min": 100, "max": 999, "Label": 100 - 999, "color": "#FFFF99"},
            {"min": 1000, "max": 4999, "Label": 1000 - 4999, "color": "#FF9966"},
            {"min": 5000, "max": 9999, "Label": 5000 - 9999, "color": "#FF6666"},
            {"min": 10000, "max": 99999, "Label": 10000 - 99999, "color": "#CC3333"},
            {"min": 100000, "Label": "100000+", "color": "#990033"},
        )
    )
)
# 绘图
map.render("全国疫情地图.html")

03-动态柱状图-案例：GDP动态柱状图绘制

1-基础柱状图

2-时间线

3-GDP动态图代码及效果图

1-拓展：列表的sort方法

2-需求分析

3-数据处理

4-代码及效果

#  GDP动态柱状图
from pyecharts.charts import Bar
from pyecharts.options import *
from pyecharts.charts import Timeline
from pyecharts.globals import ThemeType
#  读取数据
f = open("C:\\Users\\lihanting\\Desktop\\Data\\1960-2019全球GDP数据.csv", encoding="GB2312")
data_lines = f.readlines()
#  关闭文件
f.close()
#  删除第一条数据
data_lines.pop(0)
#  将数据转换为字典存储 格式为
#  {年份：[[国家，gdp], [], []], 年份：[[国家, gdp][][]]}
data_dict = {}
for line in data_lines:
    year = int(line.split(",")[0])
    country = line.split(",")[1]
    gdp = float(line.split(",")[2])
    #  如何判断字典里有没有指定的key
    try:
        data_dict[year].append([country, gdp])
    except KeyError:
        data_dict[year] = []
        data_dict[year].append([country, gdp])
'''
#  排序年份（字典内年份没有顺序，每个时间结点都是一个bar，bar是根据每个年份构建的）
#  for循环每一年的数据，基于每一年的bar对象
#  在for中将每一年的bar对象添加到时间线中
'''
sorted_year_list = sorted(data_dict.keys())
timeline = Timeline({"theme": ThemeType.LIGHT})
for year in data_dict:
    data_dict[year].sort(key=lambda element: element[1], reverse=True)  # 从小到大排 需要反转一下才是前八
    #  取出每年gdp前8的国家
    year_data = data_dict[year][0:8]
    x_data = []
    y_data = []
    for country_gdp in year_data:
        x_data.append(country_gdp[0])
        y_data.append(country_gdp[1])
    #  构建柱状图
    x_data.reverse()  # 因为取了gdp前八的国家，添加到x轴是从下向上，我们希望gdp大的在上所以这里反转 但是gdp数据也同步反转
    y_data.reverse()
    bar = Bar()
    bar.add_xaxis(x_data)
    bar.add_yaxis("GDP（亿）", y_data, label_opts=LabelOpts(position="right"))
    bar.reversal_axis()
    # 设置全局配置 标题
    bar.set_global_opts(
        title_opts=TitleOpts(title=f"{year}年全球GDP前八")
    )
    #  添加到时间点里
    timeline.add(bar, str(year))
#  设置时间线自动播放
timeline.add_schema(
    play_interval=500,
    is_timeline_show=True,
    is_auto_play=True,
    is_loop_play=False  # 是否循环播放
)
#  绘图
timeline.render("1960-2019全球GDP变化柱状图.html")