华夫饼图
展示总数据的组类别情况的一种有效图表 华夫饼的小方格用不同的颜色表示不同的类别,适合快速检视数据集中不同类别的分布和比例,并与其他数据集的分布和比例进行比较。
分类:
1.侧重展示类别数值的堆积型块状华夫饼图;
2.侧重展示类别占比的百分百华夫饼图;
3.点状华夫饼图(dot waffte chart)
绘制点状华夫饼图:
以点为单位显示离散数据;
每种颜色的点表示一个特定类别,并以矩阵形式组合在一起;
适合用来快速检视数据集中不同类别的分布和比例;
与其它数据集分布和比例比较,更容易找出其中模式;
当只有一个变量、类别时(所有点都是相同颜色),点状华夫饼图就相当于比例面积图;
绘制百分比堆积型华夫饼图
百分比堆积型的块状和点状华夫饼图,使用geomtile()函数和geompoint()函数绘制;
需要对数据进行预处理;
先计算数据的百分比;
再转换到10×10矩阵中;
绘制堆积型华夫饼图
先设定 最小元数值;
将数据按最小单元值转换到相应的矩阵中;
再使用geomtile()函数和geompoint()函数绘制块状或点状华夫饼图;
代码1:百分比堆积华夫饼图
import pandas as pd
import numpy as np
from plotnine import *
from plotnine.data import mpg
#百分比堆积型.
nrows=10 #10*10矩阵
categ_table=(np.round(pd.value_counts(mpg['class'] ) * ((nrows*nrows)/(len(mpg['class']))),0)).astype(int)
sort_table=categ_table.sort_values(ascending=False)
a = np.arange(1,nrows+1,1)
b = np.arange(1,nrows+1,1)
X,Y=np.meshgrid(a,b)
df_grid =pd.DataFrame({'x':X.flatten(),'y':Y.flatten()})
df_grid['category']=pd.Categorical(np.repeat(sort_table.index,sort_table[:]),
categories=sort_table.index, ordered=False)
#块状
base_plot=(ggplot(df_grid, aes(x = 'x', y = 'y', fill = 'category')) +
geom_tile(color = "white", size = 0.25) +
coord_fixed(ratio = 1)+
scale_fill_brewer(type='qual',palette="Set2")+
theme_void()+
theme(panel_background = element_blank(),
<