今天我们来说一说数据可视化,想必很多人在入门数据分析之后,就会经常进行可视化的工作,所谓一图胜千言,图表用的好,真的是会事半功倍的。但现实情况下,很多人遇到的问题是:
你做的图表太丑了?你做的图表到底想表达什么?图表太多,该用哪一个更好呢?
很多人看着下面这些高级上档次的数据可视化都觉得羡慕,但是到自己动手的时候又不知从何下手,或者实现难度太大,只能“望图兴叹”。
其实我们想要做好可视化并不难,最简单的方法就是要学一些高级的图表效果,折线图、柱状图这种常见图表很容易给人一种普通感,而高级的图表效果不仅可以提升颜值和逼格,而且能够更清晰地实现数据展示。
下面我就分享五个可视化中常用的高级图表,以及实现这些图表效果的具体方法。
首先,挑个可视化工具
想要做出优秀的可视化,一个好的工具是必不可少的。
其实,简单一点的如excel,这个基本人人都会用,还能配置图表颜色,是数据可视化的入门基础。但是这个对原始数据有一定要求,量不能大数据要干净,也不能绘制地图等更加酷炫的图表,最后的结果是什么呢?
结果就是,数据可视化沦为了千篇一律的柱形图和折线图,还有那一成不变的配色。
因此数据分析师一般都使用专业的可视化工具,比较常见的就是python、R这些编程语言和FineBI、tableau这些专业BI工具,这次我就以FineBI为例,教大家怎么做出高级图表。这里要先说一下FineBI进行可视化操作的流程:
数据准备:通过数据连接,将数据库中的数据以自助数据集的形式存储在业务包中,为可视化进行数据准备
数据加工:根据需求对数据进行初步加工,比如过滤、分组、排序、合并等操作
可视化图表制作:通过拖拽指标的形式,实现可视化图表的制作
仪表板设计完成:在仪表板上进行图表的排列设计,最终形成完整的可视化仪表板
高级图表一:流向地图
地图图表是我们在进行可视化中经常会用的组件之一,比较普通的就是区域地图、线地图,比较高级的比如热力地图、点地图,这些基本都是静态地图;而流向地图则是更为高级的动态图表,经常应用于区际贸易、交通流向、人口迁移、购物消费行为等场景。
1、数据准备
在进行春运迁徙流向分析之前,我们需要准备流向地图的制作数据,包括迁徙路线、城市、城市对应经纬度和ID,如下图:
在准备好数据以后,我们就可以开始制作春运迁徙流向地图了。
2、拖拽地理字段
因为我们直接准备的经度、纬度字段,因此我们先将经纬度字段转换为地理角色,然后将转换后的经纬度字段拖入横纵轴中,如下图:
3、设置细粒度
经纬度默认汇总方式为求平均,此时图表中仅显示了一个点。我们还需要一个维度字段来为经纬度字段划分细粒度,因此我们将迁徙路线字段拖拽到细粒度中,并在图表类型中选择流向地图,如下图:
然后进一步划分细粒度,即每条迁徙路线下对应的城市维度。将城市字段拖拽至细粒度下、迁徙路线字段移到图形属性下的颜色栏,就可以做出这种效果了:
4、增加流向效果
在实现按照迁徙路线和城市划分连线以后,我们还需要指定流向的顺序,将ID字段拖入图形属性下的连线栏,如下图:
点击确定进行动画效果设置。可以看到图表中即按照迁徙路线的方向来流动。
5、优化效果
如果我们想增加迁徙人数的说明,即按照迁徙人数来调整流向线的颜色,此时就需要将迁徙人数字段拖拽至图形属性下的颜色栏,并将原来的迁徙路线字段移动至标签/提示/细粒度中城市上方,选择任一位置移动即可,如下图:
高级图表二:瀑布图
瀑布图本质上属于一种柱状图,当用户想表达两个数据点之间数量的演变过程,比如薪酬支出构成,经过连续的数值加减关系得到最终的实发工资,就可以用瀑布图实现。
1、数据处理
数据准备同上,我们首先要进行数据的处理,先新增一列,并添加列名为“累计值准备”,公式如下图:
再新增列,添加列名为y值准备,选择累计值/组内,并设置取值规则为累计值,数值来自累计值准备,如下图:
再新增列,添加列名为y轴值,公式如下图:
再次新增列将其命名为标签,公式为如下图,此步骤即将基本、绩效、加班标记为增加,保险、公积金、个税标记为减少,应发工资和实发工资标记为汇总;
2、创建瀑布图
新建仪表板和组件,拖拽项目字段到横轴,拖拽y轴值、数据字段到纵轴,在图表类型下选择瀑布图,则数据字段被自动移至图形属性下的大小栏,且图表显示为瀑布图,如下图;
对项目字段选择自定义排序,自行排序如下图:
拖拽标签字段至图形属性下的颜色栏,瀑布图中的矩形块颜色即按照增加、减少、汇总来显示,如下图:
3、效果展示
调整矩形块、组件背景、标题栏等的颜色和字体,即可得到如下示例的效果:
高级图表三:人口金字塔
人口金字塔图显示人口中各个年龄组的分布,通常用于此可视化类型的一种常见分布是按年龄列出的女性和男性人口,如下图:
1、数据加工
创建自助数据集,添加字段0岁的人口数和性别,如下图,
新增一列年龄,并输入字段为"0岁",如下图:
按照上述同样的操作分别处理其他年龄段的数据,处理后的业务包如下图:
2、创建图表
新建仪表板并创建组件,选择上面新增的人口普查自助数据集表,复制待分析指标区域的人口字段,如下图:
为人口和人口1字段分别添加明细过滤条件,性别属于男和性别属于女,如下图:
将年龄拖入横轴,将人口和人口1字段都拖入纵轴,并在图表类型处选择对比柱状图,如下图:
3、效果查看
此时在图表预览处即实现了按照年龄列出的男性和女性人口。我们还可以为按照男女调整显示颜色,将性别字段拖入图形属性下的颜色栏,如下图:
高级图表四:数据条
我们知道在Excel中可以利用数据条功能,非常直观的查看选定区域中数值的大小情况,如下图:
1、创建图表
新建仪表板,创建组件并选择互联网行业业务包下的访问统计事实表,如下图:
进入组件详细设置界面,将"统计日期"、"访问平台"字段拖入纵轴,将"浏览量"字段拖入横轴,如下图:
2、选择图形
此时该图形自动展示为线型图,我们想要展示的是数据条,因此在图形属性下的形状栏中,选择切换为柱形图,如下图:
3、效果调整
因此我们对横轴的值轴进行设置,设置轴刻度自定义中的最大值,取消勾选轴标签和周标题,如下图:
点击确定保存该值轴设置,同时可以设置分类轴取消显示轴标题。在图形属性下的大小栏,调整柱宽为最大值,如下图:
此时在图表预览处看到该数据条的效果,如下图:
高级图表五:百分百堆积柱状图
具体方法是新建仪表板,待待分析指标栏点击添加计算指标,如下图:
添加的计算指标公式如下:
点击确定保存该计算指标。将产线与车间字段名拖入横轴,计算指标字段拖入纵轴,并在图表类型下选择分区柱形图,如下图:
交换该横纵轴字段,为计算指标字段开启堆积按钮,并将等级字段拖入图形属性下的颜色栏,如下图,同时为该计算指标字段设置数值格式为百分比;
最终多系列百分比堆积柱形图的效果显示如下: