【 matplotlib 库绘制流程】
1、创建画布
2、规划画布为多个不同的绘图区域,并在不同区域创建需要的坐标系实例
3、准备数据(数据爬取 -> 数据清洗 -> 数据结构化。不同的数据数组,可能要求尺寸一致)
4、通过对应的坐标系实例,调用绘图方法,在当前坐标系实例中完成绘图
5、费时间最多:图表辅助元素的定制(比如:ax.set_ylim, ax.set_title, ax.set_xlabel)
6、分析这些图表,得出结论
一、示例题目:在一张独立的画布上绘制以下参考图中的五个图表
需求一:请用柱形图和折线图在同一个坐标系展示表1数据
需求二:请用饼图展示表2数据
需求三:请用堆积柱形图展示表3数据
需求四:请用雷达图展示表4数据
表1. 2014-2021年中国中医类医疗卫生机构诊疗量
年份(年) | 诊疗量(万人次) | 同比增速(%) |
2014 | 87430 | 7.40 |
2015 | 90912 | 4.00 |
2016 | 96225 | 5.83 |
2017 | 101885 | 5.81 |
2018 | 107147 | 5.16 |
2019 | 116390 | 8.63 |
2020 | 105764 | -9.13 |
2021 | 120215 | 13.66 |
表2. 中药材消费者画像数据
年龄 | 占比(%) |
20岁以下 | 2.2 |
20-30岁 | 27.9 |
31-40岁 | 56.2 |
41-50岁 | 10.9 |
51岁以上 | 2.8 |
表3. 全国药店中药饮片供应商占比情况
年份(年) | 跨国企业占比(%) | 本土企业占比(%) |
2019 | 20.3 | 79.7 |
2020 | 22.0 | 78.0 |
2021 | 23.5 | 76.5 |
2022 | 22.5 | 77.5 |
2023 | 22.3 | 77.7 |
表4. 全国药店药品销售额占比
药品类型 | 占比(%) |
化学药 | 33 |
中成药 | 45 |
生物制品 | 3 |
保健品 | 9 |
中药饮片 | 6 |
其他 | 4 |
二、示例代码如下:
%matplotlib auto
import numpy as np
import matplotlib.pyplot as plt
# 0. 【设置中文字体】
plt.rcParams["font.sans-serif"] = ["SimHei"]
plt.rcParams["axes.unicode_minus"] = False
# 1.【可视化第一个表格数据(柱形和折线融合图)】
# 1.1 准备数据
year_x = np.arange(2014, 2022, 1) # X轴刻度值(2014-2021)
data_num = np.array([87430, 90912, 96255, 101885, 107147, 116390, 105764, 120215]) # 诊疗量
data_speed = np.array([7.40, 4.00, 5.83, 5.81, 5.16, 8.63, -9.13, 13.66]) # 同比增减
# 面向函数的 API —— pyplot 模块下的函数
# 面向对象的 API —— 坐标系类方法(直角坐标系,极坐标系)
# 1.2 创建第一个坐标系实例
ax = plt.subplot2grid((2, 3), (0, 0), colspan=3) # 直角坐标系实例
# 1.3 在第一个坐标系实例上绘制堆积柱形图
bar = ax.bar(year_x, data_num, width=0.5, color='orange')
# 1.4 创建共享x轴的第二个坐标系实例
ax_right = ax.twinx()
# 1.5 在第二个坐标系实例绘制折线图
line = ax_right.plot(year_x, data_speed, 'm^-')
# 1.6 图表辅助元素定制
ax.set_ylabel('诊疗量(万人次)')
ax_right.set_ylabel('同比增速(%)')
ax_right.set_ylim(-20, 20)
ax.set_title('2014-2021年中国中医类医疗卫生机构诊疗量')
# 2、【可视化第二个表格数据(饼图)】
# 2.1 准备数据
ratios = [2.2, 27.9, 56.2, 10.9, 2.8] # 各年龄段用户比例
labels = ['20岁以下', '20-30岁', '31-40岁', '41-50岁', '51岁以上'] # 外侧说明文字
# 2.2 创建坐标系实例并绘制饼图
ax2 = plt.subplot2grid((2, 3), (1, 0))
ax2.pie(ratios, labels=labels, radius=1,
textprops={'fontsize': 6},
wedgeprops={'width': 0.5},
pctdistance=0.75, # 调整数值标签的位置
autopct='%3.1f%%',
startangle=0, # 调整购物品类的位置
)
# 2.3 图表辅助元素定制
ax2.set_title('中药材消费者画像', fontsize=8, pad=5)
# 3、【可视化第三个表格数据(堆积柱形图)】
# 3.1 准备数据
year_x = np.arange(2019, 2024, 1) # X轴刻度值(2019-2023)
data1 = np.array([20.3, 22.0, 23.5, 22.5, 22.3]) # 跨国企业占比
data2 = np.array([79.7, 78.0, 76.5, 77.5, 77.7]) # 本土企业占比
xlabels = ['2019年', '2020年', '2021年', '2022年', '2023年']
# 3.2 创建坐标系实例并绘制堆积柱形图
ax3 = plt.subplot2grid((2, 3), (1, 1))
bar_width = 0.5 # 柱宽
ax3.bar(year_x, data1, width=bar_width)
ax3.bar(year_x, data2, bottom=data1, width=bar_width)
# 3.3 图表辅助元素定制
ax3.set_title('全国药店中药饮片供应商占比', fontsize=6)
ax3.set_xticks(year_x)
ax3.set_xticklabels(xlabels, rotation=60, fontsize=8)
# 4、【可视化第四个表格数据(雷达图)】
# 4.1 准备数据
# 各品类药品占比
score = np.array([33, 45, 3, 9, 10])
# 拼接一下,构成闭环
score = np.concatenate((score, [score[0]]))
# 维度标签
radar_labels = ['化学药','中成药','生物制品','保健品','中药饮片']
# 拼接一下,构成闭环(此处可以不拼接,为了统一而已)
radar_labels = np.concatenate((radar_labels, [radar_labels[0]]))
# 维度数(因为前面拼接了一下,所以要减1)
dim_num = len(score)-1
radians = np.linspace(0, 2 * np.pi, dim_num, endpoint=False)
# 拼接一下,构成闭环
radians = np.concatenate((radians, [radians[0]]))
# 4.2 创建极坐标系实例,并绘制雷达图
ax4 = plt.subplot2grid((2, 3), (1, 2), polar=True) # projection = 'polar'
ax4.plot(radians, score, marker='o',
markersize=2, linewidth=1, color='r')
# 4.3 图表辅助元素定制
# 设置极坐标的标签
angles = radians * 180/np.pi # 弧度转角度
# 设置新的刻度标签
ax4.set_thetagrids(angles, labels=radar_labels, fontsize=6)
# 填充多边形
ax4.fill(radians, score, alpha=0.2)
ax4.set_title('全国药店药品销售额占比', fontsize=8, pad=20)
# 5、【展示图表】
# 启用自动紧凑布局
plt.tight_layout()
plt.show()
三、图表展示