Tableau中的筛选器

  Tableau中常用的筛选器类型有:数据提取筛选器、数据源筛选器、上下文筛选器、维度筛选器、度量筛选器和表计算筛选器。这些筛选器的执行优先级从高到低依次如下图所示。下面依次对各个筛选器进行介绍。
在这里插入图片描述

1.数据提取筛选器

  打开Tableau中的数据连接界面,在界面右上角可以看到两种数据连接类型:“实时”和“数据提取”。这两者的主要区别如下:

  • 使用“实时”连接时,Tableau对于每次的拖拽或者查询动作都会发送数据查询请求给数据库,待数据库返回查询的结果集之后,Tableau再进行展现渲染。所以“实时”连接可以保证数据源端的数据永远是最新的。但当数据量较大时也会给数据库带来不小的负荷。
  • 使用“数据提取”可以解决“实时”连接带来的查询性能问题。

选择“数据提取”,打开旁边的“编辑”按钮,即可打开数据提取筛选器的编辑界面,具体如下:
在这里插入图片描述
数据提取筛选器主要包括以下几个部分:

  • 筛选器:这是可选部分,可以不设置。这一部分的用法会在数据源筛选器部分进行介绍。
  • 聚合:该部分会将数据聚合进而更进一步减少数据量。假设原始数据如下:
    在这里插入图片描述
    若此时在数据提取筛选器中设置将数据日期汇总至年,则聚合之后的数据如下:
    在这里插入图片描述
    可以看到数据量减少了,而且对公司A\B\C利润按年进行了汇总求和。但是在Tableau自带的超市数据上进行同样的操作时,除了与日期相关的字段聚合到了年之外,数据量并没有减少,推测可能是因为数据无法在其他字段上聚合起来。
  • 行数:这一部分主要用来采样。“所有行”下面有一个“增量刷新”选项,该功能会依据“使用列标识新行”字段判断哪些记录是新增的。“前”则可以提取“前N"行,而“样本”则可以随机采样 N N N行,或 N N N%比例的样本。
  • 其他:“查看历史记录”可以看到被刷新的历史记录;“隐藏所有未使用的字段”可以将不需要进行分析的字段隐藏起来,在数据提取时,这些隐藏的列不会被提取。
2.数据源筛选器

  在数据源界面的右上角,数据提取筛选器的旁边可以看到一个“筛选器”,点击旁边的“添加”按钮即可打开数据源筛选器。点击“添加”选择一个字段(以城市字段为例),然后打开“编辑”即可进入如下界面:
在这里插入图片描述
其中“常规”、“条件”和“顶部”的作用可以参考博客:https://blog.csdn.net/yeshang_lady/article/details/117326923 ,不在赘述。这里重点来看“通配符”部分。其应用举例如下(此时这个筛选的作用为选择城市名字中有“阿”字的城市)。
在这里插入图片描述
这里还有一点要注意,在数据源筛选器中,可以同时设置“常规”、“通配符”、“条件”和“顶部”中的一个或多个,最后各个筛选条件的交集即为最终的筛选结果。

3.维度筛选器和度量筛选器

  工作表界面的“标记”功能的上方也有一个“筛选器”,如下:
在这里插入图片描述
当将维度字段拖拽到该筛选器中的时候形成的是维度筛选器,而将度量字段拖拽到该筛选器中的时候形成的就是度量筛选器。具体如下:

  • 假如将“城市”字段拖拽到维度筛选器中,即可进入维度筛选器编辑界面,其具体设置界面与数据源筛选器相同,不再赘述。其作用类似于SQL中的where子句。
  • 假如将“销售额”字段拖拽到维度筛选器中,会先打开如下界面,这个界面主要用来指定将要对字段进行的操作。
    在这里插入图片描述
    选定一种操作之后,会进入如下界面,在这个界面里可以指定筛选器的值范围。
    在这里插入图片描述

维度筛选器的优先级高于度量筛选器。为了说明这两者的优先级,先构建如下工作表:
在这里插入图片描述

  • 将【细分】拖入到筛选器和颜色框中,【细分】即构成维度筛选器字段(此时,选择“公司”和“消费者”两种类型)。此时工作表如下:
    在这里插入图片描述
  • 此时将【数量】拖入到筛选框和列框中,此时【数量】构成度量筛选器(将【数量】总和的范围设置到的600到1100中),此时工作表的结果如下:
    在这里插入图片描述
    从以上可以得知,度量筛选器是对聚合之后的结果进行筛选,度量筛选器的聚类粒度为视图级别。这里也适用SQL伪代码说明(各个子模块的计算结果):
select 细分,子类别,sum_销售额,sum_数量
from (
		select 细分,子类别,sum(销售额) as sum_销售额,sum(数量) as sum_数量
		from 示例-超市
		where 细分 in [公司,消费者] --维度筛选器在此处发挥作用
		group by 细分,子类别) a -- 这里的细分是颜色框的字段
where sum_数量 between 600 and 1100 --度量筛选器在此处发挥作用

这里还要注意一点,度量字段也可以形成维度筛选器,只要在编辑字段选择【所有值】即可,具体如下:
在这里插入图片描述

5.表计算筛选器

  表计算筛选器是在计算执行之后应用,不筛选掉计算中使用的基础数据,并允许在视图中隐藏维度成员,而不影响视图中的数据。举个例子,将各个子产品按销售额进行排序,然后选出排名第5到第10的产品。首先需要构建一个计算字段:
在这里插入图片描述
接着构造如下工作簿(这里使用销售额_rank对结果做了筛选):
在这里插入图片描述
表计算是基于工作表中现有的数据进行的计算,如果仅仅使用维度筛选器挑选出上述子类别产品的话,此时其销售额排名只能从1开始,达不到想要的效果。具体如下:
在这里插入图片描述
如果想要实现按子类别产品进行筛选的话,可以在子类别字段上创建一个新的计算字段:
在这里插入图片描述
使用该计算字段替换子类别维度筛选器,其结果如下:
在这里插入图片描述

6.上下文筛选器

  默认情况下,Tableau会独立地对设置的所有筛选器进行计算,即每个筛选器都会访问数据源中的所有数据,而与其他筛选器无关。如果需要先强制执行一个筛选器,可以将该筛选器设置为上下文筛选器,此时任何其他筛选器(其他比上下文筛选器优先级低的筛选器)都自动变为相关筛选器,因为它们仅处理通过上下文筛选器的数据。
  举例如下,假设现在需要统计每个地区销售额排名前10的产品名称。先在“产品名称”字段上构建一个如下的集合:
在这里插入图片描述
然后构建如下工作表:
在这里插入图片描述
使用地区维度筛器调整地区时发现,不是每个地区都有10个产品名称,并且发现产品“摩托罗拉 充电器,全尺寸”根本不是华北地区销售额最高的前10产品。出现这个结果是因为“销售额排名前10的产品”这个集合是使用数据源中的所有数据统计出的销售额排名前10的产品名称,而非在华北地区数据上统计出的产品名称。举例,在所有数据上的销售额排名前10的产品名称集合为A,则上述工作表中的作用为:统计华北地区中集合A中的各个产品的销售额。
  如果将【地区】对应的维度筛选器设置为上下文筛选器,就可以解决这个问题。此时结果如下:
在这里插入图片描述
这样集合“销售额排名前10的产品”在计算的时候就可以只在华北地区的数据上进行计算。
TIPS:上下文筛选器的执行优先级比维度筛选器、度量筛选器及表计算筛选器高,这里先说维度筛选器是为了方便引入上下文筛选器。

参考资料
  1. 《大话数据分析:Tableau数据可视化实战》
  2. https://help.tableau.com/current/pro/desktop/zh-cn/filtering_context.htm
  3. https://www.jianshu.com/p/02114bbeb4a7
  • 3
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值