@Author : By Runsen
@Date:2020/5/14
在2020年一月初,也是我大三上的寒假,我开始写书,为什么呢?因为化工原理和化工热力学挂了,我需要重拾自己的自信。
对于一个大学三年,每天往死里干的人,竟然挂了两科。
虽然,我化工专业已经陷入了绝境,大学我主要学习日语,Python,Java和一系列数据分析软件。
所以本专栏数据分析将使用Excel,Powerbi,Python,R,Sql,SPSS,stata以及Tableau,后面还会补充BI。
第五章应该是二月份上完成的。
5.3 Tableau
Tableau致力于帮助人们查看并理解数据。Tableau 帮助任何人快速分析、可视化并分享信息。超过 42,000 家客户通过使用 Tableau 在办公室或随时随地快速获得结果。数以万计的用户使用 Tableau Public 在博客与网站中分享数据。
Tableau提供了不同平台的不同功能的数据处理产品,分别有Tableau Desktop,Tableau Server,Tableau Online,Tableau Reader和Tableau Moblie
-
Tableau Desktop:桌面分析软件,连接数据源后,只需拖拉即可快速创建交互的视图、仪表盘;
-
Tableau Server:发布和管理Tableau Desktop制作的仪表盘;管理数据源;安全信息管理;
-
Tableau Online:完全托管在云端的分析平台;在Web上进行交互、编辑和制作;
-
Tableau Reader:在桌面免费打开制作的Tableau打包工作簿;
-
Tableau Moblie:移动端APP;iPhone, iPad只支持查看;
在这里,我们只介绍Tableau Desktop桌面分析软件。
5.3.1 连接数据源
我们选择下载Tableau Desktop,这是一款付费的软件,这里不提供安装破解。Tableau官方下载链接:https://www.tableau.com/zh-cn/partner-trial?id=44247n
打开Tableau Desktop,我们可以看见如下图5-103所示的连接数据源。
Tableau提供了读取本地文件如:Excel,文本文件txt,JSON文件,Access,甚至pdf,同样Tableau可以连接服务器中的数据库。Tableau提供了内置数据集世界发展指标二号超市销售数据提供学习。
下面,我们导入美国超市销售数据, Tableau页面如下图5-104所示。
String、number、boolean、datetime是tableau的数据类型。从数据源加载数据后,tableau会自动分配数据类型,但如果满足数据转换规则,也可以更改某些数据类型。另外,用户必须指定计算字段的数据类型。
Tableau中的数据分析结果可以以各种格式保存并保存和分发。这些各种格式被称为不同的文件类型,并且它们由不同的扩展标识。它们的格式取决于它们的生产方式和使用目的。它们都存储为XML文件,可以打开和编辑。
文件类型 | 文件扩展名 | 用途 |
---|---|---|
Tableau工作簿 | .twb | 此文件格式包含工作簿中每个工作表和仪表板的信息,在每个视图中使用的字段的详细信息以及应用于度量的聚合的公式。 |
Tableau打包工作簿 | .twbx | 此文件格式包含工作簿的详细信息以及在分析中使用的本地数据。 |
Tableau数据源 | .tds | 在此文件中包含用于创建tableau报表的连接的详细信息。 |
Tableau打包的数据源 | .tdsx | 此文件与添加数据以及连接详细信息的.tds文件类似。 |
Tableau数据提取 | .tde | 此文件保存了.twb文件中使用的数据,保存在分析中应用的聚合计算。 |
Tableau书签 | .tbm | 此文件包含一个易于共享以粘贴到其他工作簿中的工作表 |
Tableau偏好设置 | .tps | 此文件存储所有工作簿中使用的颜色首选项。 |
参考:https://www.w3cschool.cn/tableau
5.3.2 选择维度和度量
在Tableau中的分析角色分为维度和度量。
维度:通常是分类字段,如名称、地区、邮寄方式等。将其拖放到功能区时,tableau不会对其进行运算,而是对视图区进行分区,维度的内容显示为各区的标题。
- 字符串、日期时间变量默认设为维度
- 数据桶:连续型数据离散化后默认设为维度
- 度量名称:所有度量变量的集合
度量:通常是数值字段,如销售额、利润、折扣等。将其拖放到功能区时,tableau默认会进行聚合运算,连续字段的取值会显示为视图中的连续轴。
- 数值:数值变量默认设为度量
- 记录数:符合筛选条件的计数
- 度量值:相应度量的具体汇总数值,一般和度量名称联合使用
美国超市销售数据中有Furniture家具、Office Supplies办公用品 和Technology技术三个类别的销售产品。
下面,我们将维度中的Category类型拖到列中,City城市拖到行中,在标记框中拖入度量值中的profit利润,在Tableau工作表中,如下图5-105所示。
这样我们很清楚看见每个州的三个类型中的产品具体的盈利情况,如果我们想具体看出某种产品的盈利情况,我们可以将Sub-Category拖到列中,如果我们想撤销,返回上一步状态,点击后退键即可,相当于快捷键Ctrl + Z
,如下图5-106所示。
5.3.3 应用可视化技术
tableau的强大之处,在于地理的可视化分析,我们在数据表中并不能很好的看出某一个州的利润情况,我们只需要在智能显示中的面板图表,选择适合分析的可视化图表。这里,我们选择全球地图,如下图5-107所示。
然后,我们可以看见在美国全州的三种类别产品的利润情况分布,如下图5-108所示。
我们从标记框中的颜色越深蓝,利润越高,而颜色呈现橙黄,说明该类别产品在该州是亏本生意。
下面,我们对比美国地图,如下图5-109所示。
在Furniture家具产品在Texas,得克萨斯州处于亏本状态。Office Supplies办公用品在California,加利福尼亚州利润非常可观,毕竟在加州有洛杉矶(Los Angeles) ,好莱坞(Hollywood) 等大城市,因此在办公用品的需求比较高。Technology技术产品在New York,California等州有很大的需求和利润。众所周知,纽约和洛杉矶是美国的互联网中心,在科技领域处于绝对的领先。Technology技术产品在Ohio,俄亥俄州处于亏本状态。在美国,俄亥俄州在各大洲经济上处于落后,俄亥俄州最出名的事件,莫过于克利夫兰骑士队在詹姆斯的带领下,首夺2016年第一个NBA总冠军。