可视化常见绘图(一)堆叠图

一.堆叠柱状图(Stacked Bar Chart)

1.1定义

堆叠柱状图可以形象地展示一个大分类包含的每个小分类的数据,以及各个小分类的占比,显示的是单个项目与整体之间的关系。堆叠柱状图分为两种类型:

  • 一般的堆叠柱状图:每一根柱子上的值分别代表不同的数据大小,各层的数据总和代表整根柱子的高度。非常适用于比较每个分组的数据总量。
  • 百分比的堆叠柱状图:柱子的各个层代表的是该类别数据占该分组总体数据的百分比。

1.2使用场景

适用场景

  1. 适用于需要对比不同分组的总量大小,同时对比同一分组内不同分类的大小

不适用场景

  1. 对比不同分组内同个分类的数据大小(百分比堆叠柱状图
  2. 对比各分组总数的大小(备份比堆叠柱状图

1.3实现

在matplotlib中使用bar函数进行实现,指定bottom参数进行堆叠,代码如下:

import numpy as np
import matplotlib.pyplot as plt

# 使用的数据集
year = [1950, 1960, 1970, 1980, 1990, 2000, 2010, 2018]
population_by_continent = {
    'africa': [228, 284, 365, 477, 631, 814, 1044, 1275],
    'americas': [340, 425, 519, 619, 727, 840, 943, 1006],
    'asia': [1394, 1686, 2120, 2625, 3202, 3714, 4169, 4560],
    'europe': [220, 253, 276, 295, 310, 303, 294, 293],
    'oceania': [12, 15, 19, 22, 26, 31, 36, 39],
}

# 初始化figure和axes
fig, ax = plt.subplots()
sum = np.zeros((1, len(year))).reshape(-1)

# 绘图
for i in population_by_continent:
    ax.bar(year, population_by_continent.get(i), label=i, alpha=0.8, bottom=sum, width=5)
    sum += population_by_continent.get(i)

# 添加图例和标题
ax.legend(loc='upper left')
ax.set_title('World population')
ax.set_xlabel('Year')
ax.set_ylabel('Number of people (millions)')

plt.show()

实现效果如下:
堆叠柱状图


二.堆叠面积图(Stacked Area Chart)

2.1定义

堆叠区域图将多个数据集绘制为垂直堆叠的区域。堆叠面积图和基本面积图一样,唯一的区别就是图上每一个数据集的起点不同,起点是基于前一个数据集的,用于显示每个数值所占大小随时间或类别变化的趋势线,展示的是部分与整体的关系。

堆叠面积图上的最大的面积代表了所有的数据量的总和,是一个整体。各个叠起来的面积表示各个数据量的大小,这些堆叠起来的面积图在表现大数据的总量分量的变化情况时格外有用。

在堆叠面积图的基础之上,将各个面积的因变量的数据使用加和后的总量进行归一化就形成了百分比堆叠面积图。该图并不能反映总量的变化,但是可以清晰的

2.2使用场景

适用场景

  1. 适用于需要反应每个数值所占百分比随时间或类别变化的趋势线,对于分析自变量是时变数据、有序数据时各个指标分量占比极为有用。
  2. 适用于对比多变量随时间变化的情况。

不适用场景

  1. 不适用于带有负值的数据集。

2.3实现

使用stackplots实现堆叠面积图,stackplots函数参数如下:

作用:绘制堆叠面积图

 stackplot(x, *args, labels=(), colors=None, baseline='zero', data=None, **kwargs)

参数1:x: ( N , ) (N,) (N,)数组,指定横轴。

参数2:*args,y: ( N , M ) (N,M) (N,M)数组,指定要绘制的数据。

参数3:labels:字符串列表:指定每个绘制数据的标签。

参数4:colors:颜色列表:指定堆叠区域的着色,不必与y完相同,颜色会循环使用。

参数5:baseline:限定字符串:指定计算基线的方法,可选:

  • zero:恒定零基线,即一个简单的堆积图。
  • sym:围绕零对称
  • wiggle:最小化平方斜率的总和。
  • weighted_wiggle: 带权重,权重占每一层的大小

参数6:data:未知

参数7:**kwargs:接收的关键字参数传递给fill_between方法。

import numpy as np
import matplotlib.pyplot as plt


year = [1950, 1960, 1970, 1980, 1990, 2000, 2010, 2018]
population_by_continent = {
    'africa': [228, 284, 365, 477, 631, 814, 1044, 1275],
    'americas': [340, 425, 519, 619, 727, 840, 943, 1006],
    'asia': [1394, 1686, 2120, 2625, 3202, 3714, 4169, 4560],
    'europe': [220, 253, 276, 295, 310, 303, 294, 293],
    'oceania': [12, 15, 19, 22, 26, 31, 36, 39],
}

fig, ax = plt.subplots()
ax.stackplot(year, population_by_continent.values(),
             labels=population_by_continent.keys(), alpha=0.8)
ax.legend(loc='upper left')
ax.set_title('World population')
ax.set_xlabel('Year')
ax.set_ylabel('Number of people (millions)')

plt.show()

实现效果如下:
堆叠

  • 2
    点赞
  • 34
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小猪猪家的大猪猪

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值