一、概念介绍
马赛克图(Mosaic plot),基于列联表的数据排布,展现二维定性变量下的取值大小,我们可以将它想象成三维柱状图的俯视,颜色差异或面积大小常被用于区分每个块的赋值大小。
· 什么是列联表?
如上所示,列联表会呈现两个维度定性变量的取值,比如:维度一是 性别,维度二是 评级(优/良),则a=性别为男生,评级为优的人数。
如果要展示这样一个分布的话,柱状图是该选择复合柱状图还是堆叠柱状图更合适呢?
在做选择之前,我们必须要了解清楚可视化图像展示数据的渠道和导向,如果是复合柱状图,被选作横坐标的类别是我们不会细致挖掘的类差异。
如我们选择性别作为横坐标,评级作为hue,那在分析的过程中,我们大概率会以这样一种范式:“对于女性群体而言,其评级为优的人数为c,多于(少于)评级为良的人数d;而对于男性群体而言,拥有相同的差异(结论相反)”。在上述分析文字中,也即是我们视觉第一眼看到的结论中,我们会将靠的更近的图形进行对比,而不会专门挑出评级为优的群体,对比性别比例。
因此&