Tableau(1)基本操作与计算

1 可视化

  • 数据可视化
    利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来,再进行交互处理的理论、方法和技术。
  • 应用领域
    最早运用于计算机科学中,并形成了可视化技术的一个重要分支——科学计算可视化
    科学计算可视化能够把科学数据,包括测量获得的数据、图像或是计算中涉及、产生的数字信息变为直观的、以图像图形信息表示的、随时间和空间变化的物理现象或物理量呈现在研究者面前,使他们能够观察、模拟和计算。
  • 用图表讲故事
    通过数据可视化,寻找三个方面:模式、关系和异常
    1.模式:数据中的某种规律
    2.关系:各影响因素之间的相关性,也指各个图形之间的关系
    3.异常:问题数据

2 Tableau

2.1 Tableau家族产品

  • Tableau desktop
    桌面端分析工具,客户端本地进行安装,支持windows和Mac,可连接到各类数据源,通过拖放的方式快速地创建出交互、美观、智能的视图和仪表盘。
  • Tableau server
    服务器端应用程序,用于发布和管理tableau desktop制作的仪表盘,发布和管理数据源,管理用户以及权限,通过web方式访问,支持浏览器进行分析。
  • Tableau online
    是tableau的云商务智能平台,是tableau server的托管版本,通过发布为云服务,随时随地基于web浏览器或者是移动端进行实时交互的数据查询及分析。
  • Tableau reader
    是一款免费的桌面应用程序,用来打开tableau desktop软件创建的视图文件,开发人员基于tableau desktop创建可视化的仪表盘,其他人通过tableau reader阅读分析内容。
  • Tableau public
    是一款免费的服务产品,用户将创建的视图发布在tableau public上,可以分享到网页、博客或者是其他社交网站上。

2.2 Tableau产品优势

  • 可以连接任何数据源
    目前市面上的数据库,都可以连接。不能直连的,可以通过odbc连接。
  • 学习门槛低
  • 轻量级
    Tableau 通过Tableau desktop,一旦与数据源建立了连接,就能通过简单的拖拽功能来创建一个报表,如果是其它工具从搭建环境到开发一张报表所用的时间是一天,那么Tableau是一个小时。但是要发布的话,还要搭建一个Tableau server。
  • 更智能
    1.自动识别唯独和度量、着色、自动求和等
    2.推荐展示的方式
    3.自动识别关联关系
  • 亲切感
  • 丰富的图表展示
    heatmap、maps、treemap等,非常直观能够迅速帮助数据分析人员发现数据问题。

2.3 Tableau页面

在这里插入图片描述

2.4 Tableau数据与文件类型

2.4.1 数据类型

String、number、boolean、datetime是tableau的数据类型。从源加载数据后,tableau会自动分配数据类型,但如果满足数据转换规则,也可以更改某些数据类型。另外,用户必须指定计算字段的数据类型。
在这里插入图片描述

2.4.2 文件类型

.twb、.twbx、.tds、.tdsx、.tde、.tbm、.tps是tableau的文件类型。
在这里插入图片描述

2.5 Tableau数据源

Tableau可以连接到广泛使用的所有常用数据源。Tableau的本机连接器可以使用以下类型的数据源:

  • 文件系统:csv、excel
  • 关系系统:oracle、sqlserver、db2
  • 云系统:windows Azure、Google BigQuery
  • 其他源:odbc
2.5.1 数据源特征
  • 实时连接
    连接实时特性用于实时数据分析。在这种情况下,Tableau连接到实时数据源并继续读取数据。所以分析的结果是第二次,最新的变化反映在结果中。但在不利方面它负担源系统,因为它必须继续发送数据到tableau
  • 数据缓存
    Tableau还可以通过将数据缓存在内存中的数据,并在分析数据时不再连接到源。当然,根据内存的可用性,缓存的数据量将有限制。
  • 组合数据源
    Tableau还可以通过将内存缓存在内存中来处理内存中的数据,并在分析数据时不再连接到源,当然,数据内存的可用性,缓存的数据量将有限制。
2.5.2 数据源连接

1.打开tableau,选择数据源,可以是文件或数据库或服务器
在这里插入图片描述
2.选中文件作为数据源后,会有一个预览界面,对数据源进行修改和编辑
在这里插入图片描述
3.确定好数据源及数据表之后,就可以在工作薄里面编辑和创建个性化的报表
在这里插入图片描述

2.6 Tableau基本操作

  • 第一步:连结到数据源
    创建任何tableau数据分析报告涉及3个步骤
    1.连接到数据源:它涉及定位数据并使用适当类型的连接来读取数据
    2.选择维度和度量:这包括从源数据中选择所需的列进行分析
    3.应用可视化技术:这涉及将所需的可视化方法(特定图表或图形类型)应用于正在分析的数据。
    在这里插入图片描述
  • 第二步:选择维度和度量
    通过决定维度和度量来选择要分析的数据
    维度数描述性数据,而度量数数字数据。当放在一起时,他们帮助我们可视化关于作为度量的数据的维度数据的性能。选择类别和区域作为维度和销售额作为度量。拖放他们,如图所示,结果显示每个区域的每个类别的总销售额。
    在这里插入图片描述
  • 第三步:应用可视化技术
    在上一步中,我们看到数据仅作为数字可用。我们必须读取和计算每个值来判断性能。但我们可以将它们看作是具有不同颜色的图表,一遍更快地做出判断。
    我们将总和(销售额)列从“标记”标签拖到“列”货架。然后,显示销售额数值的表格会自动变为条形图。
    在这里插入图片描述

2.7 Tableau连结方式

  • 数据提取连结
    数据提取是把数据从数据源加载到本地,可以实现离线分析
  • 实时连结
    数据是实时的,即与数据源同步,保存tableau文件时不会把数据存取到本地。如果选择的是“数据实时连结”,则可以选择“立即更新”或“后续自动更新”
    在这里插入图片描述
    在这里插入图片描述

2.8 Tableau多表连接

  • 创建连结:
    Tableau通过使用“数据”菜单中“编辑数据源”下可用的数据窗格提供了连接表的功能,让我们考虑数据源[示例-超市]在“订单”和“退货”表之间创建一个连接
    在这里插入图片描述
  • 编辑连结类型:
    Tableau自动创建的连接类型可以手动更改,为此我们点击显示连接的两个圆圈的中间。将在其下显示一个弹出窗口,其中显示可用的四种类型的连接。此外,Tableau自动灰化某些类型的连接,它们根据数据源中存在的数据发现不相关。我们也可以尝试更改左连结,右连结与完全连结
    在这里插入图片描述

2.9 Tableau数据混合

  • 先准备要导入tableau的数据
    数据混合是tableau中非常的功能.在多个数据源中有要在单个视图中一起分析的相关数据时使用。如销售数据存在于关系数据库中,而销售目标数据存在于Excel电子表格中,然后,为了将实际销售额与目标销售额进行比较,我们可以根据常用维度混合数据,以获取销售目标度量。数据混合中涉有的两个来源称为主数据源和辅助数据源。将在主数据源和辅助数据源之间创建左连接,其中所有数据行都来自辅助数据源的主数据行和匹配数据行
    在这里插入图片描述
    在这里插入图片描述
  • 创建本地Excel及远程MySQL数据源
    1.先添加本地Excel文件数据源:客户信息表.xlsx
    2.添加MySQL数据源
    在这里插入图片描述
  • 具体步骤
    1.将northwind.xls导入MySQL服务器中
    2.在tablau中导入客户信息表.xlsx
    3.在tableau中连入MySQL
    在这里插入图片描述

2.10 Tableau数据提取

  • 先准备要导入Tableau的数据
    Tableau中的数据提取从数据源创建数子集,这有助于通过应用筛选器来提高性能,它还有助于将Tableau的某些功能应用于数据源中可能不可用的数据,例如在数据中查找不同的值。但数据提取功能最常用于创建要存储在本地驱动器中的提取,以供Tableau脱机访问。数据的提取通过遵循菜单【数据->编辑数据源筛选器】
    在这里插入图片描述
  • 提取华北及东北地区的家具销售利润低于5000的数据
    1.筛选“地区”
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    2.筛选“类别”
    在这里插入图片描述
    在这里插入图片描述
    3.筛选“利润”
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

2.11 Tableau编辑源数据

1.检查元数据
将“订单”表拖动到数据画布,显示列名称及其数据类型。
字符串数据类型显示为Abc,数字数据类型显示为#
在这里插入图片描述
2.更改数据类型
连接到数据源,tableau将捕获源的元数据详细信息,如列及其数据类型,这用于创建视图使用的维度,度量和计算字段,我们可浏览元数拓并更改其某些特定要求的某些属性
在这里插入图片描述
3.列的重命名和隐藏
可以使用重命名选项更改列名称。另外,我们可以隐藏一个列,使它不会出现在我们创建的数据视图中。通过单击元数据网格中的数据类型图标可以获得这些选项。可以试着修改"订单ID"列名为"订单编号",或尝试隐藏该列
在这里插入图片描述
4. 列别名
可以为数据源的每一列分配一个别名,以帮助更好的了解列的性质。我们可以从上面的步骤中选择别名选项,然后出现用于创建或编辑别名选项。
可以尝试着为"省/自治区"的"上海"这一列数据修改别名为:“上海市”
在这里插入图片描述
在这里插入图片描述

2.12 Tableau字段操作

2.12.1 合并字段

我们可以组合两个维度字段来创建一个字段。此组合字段的名称是单个字段的组合。通过将两个字符串连接成一个以逗号分隔的字符串,维度中的值将合并为单个值。但是可以使用重命名字段操作更改此默认名称

  • 例如:将“国家”,“地区”,“城市”合并为一个“地址”字段
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
2.12.2 字段分层

某些情况下,我们需要对几个变量创建一个分层结构。以便在制图或数据分析时随时向下钻取数据

  • 例如:将【类别,子类别,产品名称】作为一个分层结构,并命名为【产品类别】,以方便 向下查看
    创建分层,拖拽“产品分类”到“行”
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
2.12.3 字段分组
  • 按文件夹分组
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
2.12.4 字段拆分

如果数据中有包含多个信息单元的字符串字段(例如客户的名字和姓氏),在将该字段中的值拆分为多个单独的字段的情况下,数据分析起来将更为轻松
在这里插入图片描述
在这里插入图片描述

2.12.5 计算字段

如果基础数据未包括你实际工作中所需的所有字段,你可以在tableau中创建新字段,然后将其保存为数据源的一部分。
在实际的业务中,我们可能更关心“实际销售额”(实际销售额)=销售额*(1-折扣),但现在表中没有这个字段,只能创建一个名叫“实际销售额”的计算字段
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.12.6 集

实际工作中,如果我比较关注两块数据,如在示例超市表中,我希望了解利润亏损的产品情况和利润大于5000的产品情况,这个该怎么实现呢???

  • 例1:利用Tableau集实现使用销售数据计算至少买过5000元商品的客户占总客户的百分比
    1.创建集
    在这里插入图片描述
    在这里插入图片描述
    2.创建集添加行和列
    在这里插入图片描述
    在这里插入图片描述
    3.计算百分比、构建工作表
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    4.计算百分比分析和更改标题
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    5.利用占比表现
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  • 例2:示例中多少客户在2016年和2017年都购买过我们的产品
    1.把客户名称、订单日期、销售额放到相应的地方。
    在这里插入图片描述
    2.筛选2016
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    3.同样的放发筛选2017
    4.创建合并集
    在这里插入图片描述
    在这里插入图片描述
    5.结果
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

2.13 Tableau函数与计算

2.13.1 Tableau中的运算符

运算符是一个符号,通知编译器执行特定的数学或逻辑操作。tableau有多个运算符用于创建计算字段和公式。

1.运算符类型

  • 常规运算符
    在这里插入图片描述
  • 算术运算符
    在这里插入图片描述
  • 比较运算符
    在这里插入图片描述
  • 逻辑运算符
    在这里插入图片描述
    2.运算符优先级
    在这里插入图片描述
2.13.2 Tableau函数

任何数据分析都涉及大量的计算。在tableau中,计算编辑器用于将计算应用于正在分析的字段。tableau具有许多内置函数,它们有助于创建复杂计算的表达式:
https://onlinehelp.tableau.com/v10.3/pro/desktop/zh-cn/help.htm

  • 数字函数
    在这里插入图片描述
    在这里插入图片描述
  • 字符串函数
    在这里插入图片描述
    在这里插入图片描述
  • 日期函数
    在这里插入图片描述
    在这里插入图片描述
  • 逻辑函数
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    1.例1:IIF(7>5, "Seven is greater than five", "Seven is less than five")
    在这里插入图片描述
    2.例2:利用利润,增加一列为利润评价
    新建字段
    在这里插入图片描述
    切换到数据源
    在这里插入图片描述
    在这里插入图片描述
    3.例3:增加数量评价列
    在这里插入图片描述
    在这里插入图片描述
    4.例4:增加邮寄方式列
    在这里插入图片描述
    在这里插入图片描述
    5.例5:增加VIP客户列
    在这里插入图片描述
  • 聚合函数
    在这里插入图片描述
    1.例1:求和及平均
    在这里插入图片描述
    在这里插入图片描述
    2.例2:求统计
    在这里插入图片描述
    在这里插入图片描述
  • 类型转换函数
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
2.13.3 Tableau计算字段

Tableau中的数值计算使用公式编辑器中提供的大量内置函数完成。在本例中,我们将看到如何对字段应用计算。计算可以简单地减去两个字段的值或将聚合函数应用于单个字段。
颜色含义:函数(淡蓝色) 字段(橙色)运算符(黑色)参数(紫色)注释(绿色)
如:接下来的我们的目标是研究不同运输方式的产品的利润和折扣之间的差异。因此我们创建一个公式,从利润中减去折扣
1.例1:邮寄方式与利润折扣关系 在这里插入图片描述
在这里插入图片描述
2.例2:平均销售额与邮寄方式的关系
在这里插入图片描述
在这里插入图片描述

  • 字符串计算
    例:查看包含“安”字的城市的销售情况
    在这里插入图片描述
    在这里插入图片描述
  • 日期计算
    例1:每种商品的“订单日期”与“发货日期”的时间总间隔
    在这里插入图片描述
    在这里插入图片描述
    例2:列出“类别”与“利润”与(订单和发货日期时间差)的关系
    在这里插入图片描述
2.13.4 表计算
  • Tableau函数与计算中最后一个知识点是:表计算。表计算是一种转换,基于详细级别中的维度将该转换应用于视图中单一度量的值。
  • 对于任何Tableau视图,都有一个由视图中的维度确定的虚拟表。此表不会与数据源中的表混淆。具体来说,虚拟表同“详细信息级别”内的维度来决定,这意味着由Tableau工作表中任何以下工作区或卡上的维度来决定
  • 表计算可以理解为是一种功能更强大的计算字段
  • 表计算类型
    差异计算、百分比差异计算、百分比计算、总额百分比计算、排名计算、百分位计算、汇总计算、移动计算

1.差异计算
对于视图中的每个标记,“差异”表计算将计算表中当前值与另一个值之间的差异
例如:查看销售额每年中逐月增加或逐月减小的幅度
1)先列出某年某季某月的销售额(原始视图)
2)复制一份原始数据并改名为“差异计算”
在这里插入图片描述
3)添加“差异计算”
在这里插入图片描述
在这里插入图片描述
4)一个月比前一个月,点击编辑差异计算
在这里插入图片描述
在这里插入图片描述
5)二月比一月的差异
在这里插入图片描述
在这里插入图片描述
2.百分比差异计算
“百分比差异”表计算将计算表中当前值与另一个值之间的百分比差异。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
3.百分比计算
“百分比”表计算会将值计算为某 个其他值的百分比—通常计算为表中前一个值的百分比。如按年分类(从左至右)和按季度和月分类(从上到下)的总销售额
在这里插入图片描述
4.总额百分比计算
"总额百分比"表计算会将值计算为当前分区中所有值的百分比
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
5.排名计算
给定年度内每个月在总销售额中从最高销售额(排在第1位)到最低销售额(排在第12位)的排名情况
“排名”表计算将计算分区中每个值的排名
在这里插入图片描述
在这里插入图片描述
5.百分位计算
“百分位”表计算在分区中计算每个值的百分位排名
在这里插入图片描述
在这里插入图片描述
想要了解给定年度每个月的值(以百分位表示),而不是了解绝对销售值。对于此类表计算,分配给最低排名值的百分位为0,分配给最高排名值的百分位为100(假设计算按升序进行,这是默认值)。系统会按排为把有其他值分配百分位。因为,对于1,3,22,67这一组的四个值,百分位将分别为0%,33%,67%和100%
在这里插入图片描述
6.汇总计算
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
7.移动计算
"移动计算"表计算(有时称为滚动计算)会对当值之前和/或之后指定数目的值执行聚合(总计值、平均值、最小值、最大值)来确定视图中的标记值。移动计算通常用于平滑短期数据婆动,这样可以查看长期趋势。例如:对于证券数据,市场每天都在波动,很难通过每日的上升和下降把握全局。可以使用移动计算来定义一系列值通过所选聚合进行汇总
要【了解总销售额在一段时间内的趋势】,如:我想查看每一年每一季季末的平均销售额,而不是季末那一个月的销售额(如:我想查看2013年10月份的数据是:前两个月,即8月,9月及10月的平均销售额,而不是10月份的销售,其他的依此类推)
在这里插入图片描述
对比【移动计算后的数据】与【原始数据】,验证数据的正确性。
如:2013年的第一季的最后一个月:三月的原始销售额为:167.17373,移动计算后值为:167,902.57=(231,597.62+104,936.37+167,173.73)/3
再如:2013年第一季度的第二个月:二月的原始销售额为
104936.37,移动计算后值为:168266.99=(231597.62+104936.37)/2
再如:2013年第二季度的第一个月:四月份的原始销售额为:96984.69移动计算后值为:123031.60=(104936.37+167173.73+96984.69)/3
在这里插入图片描述
8.快速表计算
快速表计算是一个单步骤过程,在此过程中,您可以从列表中选择常用的表计算类型。tableau会为该计算类型自动应用最典型的设置
快速表计算的步骤:
1、单击视图中的度量从上下文菜单中选择“快速表计算”
2、从子菜单中选择计算类型
如果结果令人满意,就表示您完成操作。否则,可以再次单击该度量并选择“编辑表计算”以继续使用计算
可用快速计算类型的列表与您在“表计算”对话框中看到的默认计算类型的列表并不完全匹配。例如,“复合增长率”快速表计算是选择了“计算复利率”选项的“百分比差异”表计算。如果想要知道如何定义任何给定的快速表计算,请添加计算,然后回去编辑该计算,以查看它在“表计算”对话框中的配置方式。

9.临时计算
临时计算是您在处理视图中功能区上的字段时可创建和更新的计算
临时计算也称为调用类型输入计算或内联计算
在这里插入图片描述

  • 3
    点赞
  • 80
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值