基于Tableau的数据可视化(一) ——初体验

导语

Tableau是一款定位于数据可视化的智能展现工具,可以用来实现交互的、可视化的分析和仪表板应用,从而帮助企业快速地认识和理解数据,以应对不断变化的市场环境与挑战。简便、快速地创建视图和仪表板是Tableau最大的优点之一,本文主要内容为,

  • 介绍Tableau的数据基础
  • 学习实现利用Tableau快速创建基本的视图
  • 通过一个案例展示Tableau创建、设计、保存视图和仪表板的基本方法

一、数据准备

本文案例的样本数据下载链接为,指标为售电量,统计周期为2014年01月~2014年06月,数据存储为Excel文件。数据共有九列变量,其中,

  • 用电类别是对售电量市场的进一步细分,包括大工业、居民、非居民、商业等9类
  • 当期值为统计周期对应时间的售电量
  • 同期值为上一年相同月份的售电量
  • 月度计划值为当月的计划值

Excel文件内容如下图所示,

在这里插入图片描述

1.1 为Tableau导入数据表

打开Tableau桌面版,“新建数据源” -> “ Excel”,将该数据表导入到Tableau中,进入Tableau工作区。数据源中数据与Tableau中数据对应关系如下图所示。

在这里插入图片描述

1.2 理解数据窗口

Tableau连接数据后会将数据显示在工作区的左侧,我们称之为数据窗口。首先如何来理解数据窗口呢?

在这里插入图片描述

我们知道,数据源Excel文件的内容有九列,在Tableau中,将数据表中的一列变量称为字段。因此,数据源Excel文件有九个字段。

窗口的下方分别为维度窗口和度量窗口,分别用来显示导入的维度字段和度量字段。

维度窗口显示的数据角色为维度,往往是一些分类、时间方面的定性字段;度量窗口显示的数据角色为度量,往往是数值字段。

Tableau连接数据时会对各个字段进行评估,根据评估自动地将字段放入维度窗口或度量窗口。通常Tableau的这种分配是正确的,但是有时也会出错。。这种情况下,我们可以把度量窗口的字段拖放至维度窗口中,
以调整数据的角色。例如将字段“当期值”转换为维度,只需将其拖放到维度窗口中即可。

数据窗口中各字段前如 Abc=#等符号是标示字段类型的图标。Tableau支持的数据类型见下表,

在这里插入图片描述

1.3 字段类型转换

Tableau会自动对导入的数据分配字段类型,但有时自动分配的字段类型不是我们所希望的。例如上图中,我们发现字段 “省市” 和 “统计周期” 显示的字段类型都为字符串 Abc ,而不是我们想要的地理和日期类型,这时就需要我们手动调整。调整方法为,

在字段名 单击鼠标右键,在弹出的对话框中选择 “地理角色” -> “省/市/自治区”,这时 “省市”
便成了地理字段,并且在选择后度量窗口会自动显示相应的经纬度字段

对于 “统计周期”,同样选择 “更改数据类型” -> “日期” 即可

在这里插入图片描述

二、创建视图

在对Tableau的数据有了基本的认识后,我们便可以创建Tableau视图了,本节主要介绍如何利用数据窗口中的数据字段创建单个视图。Tableau作图非常简单,拖放相关字段到相应的功能区,Tableau就会自动依据功能区相关功能将图形即时显示在视图区中。

2.1 行列功能区

以制作各省当期售电量柱形图为例,选定字段“省市”,用鼠标左键按住后拖放到列功能区,这时横轴就按照各省名称进行了分区,各省市成为了区标题,如下图所示,

在这里插入图片描述

同理,拖放字段 “当期值” 到行功能区,这时字段会自动显示成 “总计(当期值)”,视图区显示的便是售电量各省累计值柱形图,如下图所示,

在这里插入图片描述

当然行列功能区可以不止拖放一个字段,例如我们可以将字段 “同期值” 拖放到 “总计(当期值)” 的右边,Tableau这时会根据度量字段 “当期值” 和 “同期值” 分别作出对应的轴,结果如下图所示,
在这里插入图片描述

维度和度量都可以拖放到行功能区或列功能区,只是横轴、纵轴的显示信息会相应地改变,比如对于上图,我们可以将行、列上的字段互换,这时省市显示在纵轴,横轴变成了当期值和同期值,如下所示,

在这里插入图片描述

拖放度量字段“当期值”到功能区,字段会自动显示成“总计(当期值)”,这反映了Tableau对度量字段进行了聚合运算,缺省的聚合运算为总计。Tableau支持多种不同的聚合运算,如总计、平均值、中位数、最大值、计数等。

如果想改变聚合运算的类型,比如想计算各省的平均值,只需在行功能区或列功能区的度量字段上,右键“总计(当期值)”或单击右侧小三角形,在弹出对话框中选择“度量” -> “平均值” 即可,如下图所示,

在这里插入图片描述

说明,Tableau求平均值是对行数的平均,以上海为例,其平均值为当期值总和除以省市为上海的行数,在原数据中每个省有6个月的当期值,每个月又分为9个用电类别,则出现上海的总行数为6×9=54,即平均值=总计/54。

2.2 改变颜色、大小和标签

创建视图时,经常需要定义形状、颜色、大小、标签等图形属性。在Tableau里,这些过程都
将通过操作标记卡来完成。

如果想让不同省市显示不同颜色,可利用标记卡中的颜色来完成,只需将字段 “省市” 拖放到颜色里即可,如下图所示,

在这里插入图片描述

这时,卡功能区的下方会自动出现颜色图例,用以说明颜色与省市的对应关系。单击颜色图例右上角处,在弹出框中可以对颜色图例进行设置,如编辑标题、排序、设置格式等。其中单击选项“编辑颜色”,进入颜色编辑页面,可以对不同的区域自定义不同的颜色。比如要将上海的蓝色改为红色,可选择“编辑颜色”进入颜色编辑页面。

在这里插入图片描述

如果要对视图中的标记添加标签,如将当期值的数值以标签的形式显示在图上,只需将字段 “当期值” 拖放到标签即可,如下图所示,

在这里插入图片描述

2.3 不同数据在同一轴上展示

当想在同一个轴上展示两种不同的数据时,显然上面的图不符合要求。下面我们利用度量值和度量名称来完成两列不同数据共用一个轴的操作。

  • 首先还是拖放字段“省市”到列功能区,
  • 然后拖放度量值到行功能区,这时在左下方会显示度量值包含了哪些度量,Tableau默认的度量值会包含所有的度量。
  • 由于我们只需要当期值和同期值,因此右键行上的度量值,选择“筛选器”,只保留当期值和同期值

在这里插入图片描述

为了区分同期值和当期值,我们将其染上不同的颜色,将度量名称拖放到“颜色”,这时柱状图
按颜色分成了当期值和同期值,二者共同一个纵轴。如下图所示,

在这里插入图片描述
如果习惯将当期值和同期值分开为两个柱子,只需将度量名称拖放到列功能区,放置在省市的右边,如下图所示,

©️2020 CSDN 皮肤主题: 大白 设计师:CSDN官方博客 返回首页