Tableau中的筛选器

Sun_Sherry(停更)

已于 2022-12-03 00:00:00 修改

阅读量1.2w

点赞数 3

分类专栏： Tableau 文章标签：数据库 python mysql

于 2021-08-03 21:27:33 首次发布

本文链接：https://blog.csdn.net/yeshang_lady/article/details/119348365

版权

Tableau 专栏收录该内容

33 篇文章

订阅专栏

Tableau中常用的筛选器类型有：数据提取筛选器、数据源筛选器、上下文筛选器、维度筛选器、度量筛选器和表计算筛选器。这些筛选器的执行优先级从高到低依次如下图所示。下面依次对各个筛选器进行介绍。
在这里插入图片描述

1.数据提取筛选器

打开Tableau中的数据连接界面，在界面右上角可以看到两种数据连接类型：“实时”和“数据提取”。这两者的主要区别如下：

使用“实时”连接时，Tableau对于每次的拖拽或者查询动作都会发送数据查询请求给数据库，待数据库返回查询的结果集之后，Tableau再进行展现渲染。所以“实时”连接可以保证数据源端的数据永远是最新的。但当数据量较大时也会给数据库带来不小的负荷。
使用“数据提取”可以解决“实时”连接带来的查询性能问题。

选择“数据提取”，打开旁边的“编辑”按钮，即可打开数据提取筛选器的编辑界面，具体如下：
在这里插入图片描述
数据提取筛选器主要包括以下几个部分：

筛选器：这是可选部分，可以不设置。这一部分的用法会在数据源筛选器部分进行介绍。
聚合：该部分会将数据聚合进而更进一步减少数据量。假设原始数据如下：

若此时在数据提取筛选器中设置将数据日期汇总至年，则聚合之后的数据如下：

可以看到数据量减少了，而且对公司A\B\C利润按年进行了汇总求和。但是在Tableau自带的超市数据上进行同样的操作时，除了与日期相关的字段聚合到了年之外，数据量并没有减少，推测可能是因为数据无法在其他字段上聚合起来。
行数：这一部分主要用来采样。“所有行”下面有一个“增量刷新”选项，该功能会依据“使用列标识新行”字段判断哪些记录是新增的。“前”则可以提取“前N"行，而“样本”则可以随机采样 $N$ 行，或 $N$ %比例的样本。
其他：“查看历史记录”可以看到被刷新的历史记录；“隐藏所有未使用的字段”可以将不需要进行分析的字段隐藏起来，在数据提取时，这些隐藏的列不会被提取。

2.数据源筛选器

在数据源界面的右上角，数据提取筛选器的旁边可以看到一个“筛选器”，点击旁边的“添加”按钮即可打开数据源筛选器。点击“添加”选择一个字段(以城市字段为例)，然后打开“编辑”即可进入如下界面：
在这里插入图片描述
其中“常规”、“条件”和“顶部”的作用可以参考博客：https://blog.csdn.net/yeshang_lady/article/details/117326923 ，不在赘述。这里重点来看“通配符”部分。其应用举例如下(此时这个筛选的作用为选择城市名字中有“阿”字的城市)。
在这里插入图片描述
这里还有一点要注意，在数据源筛选器中，可以同时设置“常规”、“通配符”、“条件”和“顶部”中的一个或多个，最后各个筛选条件的交集即为最终的筛选结果。

3.维度筛选器和度量筛选器

工作表界面的“标记”功能的上方也有一个“筛选器”，如下：
在这里插入图片描述
当将维度字段拖拽到该筛选器中的时候形成的是维度筛选器，而将度量字段拖拽到该筛选器中的时候形成的就是度量筛选器。具体如下：

假如将“城市”字段拖拽到维度筛选器中，即可进入维度筛选器编辑界面，其具体设置界面与数据源筛选器相同，不再赘述。其作用类似于SQL中的where子句。
假如将“销售额”字段拖拽到维度筛选器中，会先打开如下界面，这个界面主要用来指定将要对字段进行的操作。

选定一种操作之后，会进入如下界面，在这个界面里可以指定筛选器的值范围。

维度筛选器的优先级高于度量筛选器。为了说明这两者的优先级，先构建如下工作表：
在这里插入图片描述

将【细分】拖入到筛选器和颜色框中，【细分】即构成维度筛选器字段(此时，选择“公司”和“消费者”两种类型)。此时工作表如下：
此时将【数量】拖入到筛选框和列框中，此时【数量】构成度量筛选器(将【数量】总和的范围设置到的600到1100中），此时工作表的结果如下：

从以上可以得知，度量筛选器是对聚合之后的结果进行筛选，度量筛选器的聚类粒度为视图级别。这里也适用SQL伪代码说明(各个子模块的计算结果)：

select 细分,子类别,sum_销售额,sum_数量
from (
		select 细分,子类别,sum(销售额) as sum_销售额,sum(数量) as sum_数量
		from 示例-超市
		where 细分 in [公司,消费者] --维度筛选器在此处发挥作用
		group by 细分,子类别) a -- 这里的细分是颜色框的字段
where sum_数量 between 600 and 1100 --度量筛选器在此处发挥作用

这里还要注意一点，度量字段也可以形成维度筛选器，只要在编辑字段选择【所有值】即可，具体如下：
在这里插入图片描述

5.表计算筛选器

表计算筛选器是在计算执行之后应用，不筛选掉计算中使用的基础数据，并允许在视图中隐藏维度成员，而不影响视图中的数据。举个例子，将各个子产品按销售额进行排序，然后选出排名第5到第10的产品。首先需要构建一个计算字段：
在这里插入图片描述
接着构造如下工作簿(这里使用销售额_rank对结果做了筛选)：

表计算是基于工作表中现有的数据进行的计算，如果仅仅使用维度筛选器挑选出上述子类别产品的话，此时其销售额排名只能从1开始，达不到想要的效果。具体如下：
在这里插入图片描述
如果想要实现按子类别产品进行筛选的话，可以在子类别字段上创建一个新的计算字段：

使用该计算字段替换子类别维度筛选器，其结果如下：

6.上下文筛选器

默认情况下，Tableau会独立地对设置的所有筛选器进行计算，即每个筛选器都会访问数据源中的所有数据，而与其他筛选器无关。如果需要先强制执行一个筛选器，可以将该筛选器设置为上下文筛选器，此时任何其他筛选器(其他比上下文筛选器优先级低的筛选器)都自动变为相关筛选器，因为它们仅处理通过上下文筛选器的数据。
举例如下，假设现在需要统计每个地区销售额排名前10的产品名称。先在“产品名称”字段上构建一个如下的集合：
在这里插入图片描述
然后构建如下工作表：

使用地区维度筛器调整地区时发现，不是每个地区都有10个产品名称，并且发现产品“摩托罗拉充电器，全尺寸”根本不是华北地区销售额最高的前10产品。出现这个结果是因为“销售额排名前10的产品”这个集合是使用数据源中的所有数据统计出的销售额排名前10的产品名称，而非在华北地区数据上统计出的产品名称。举例，在所有数据上的销售额排名前10的产品名称集合为A，则上述工作表中的作用为：统计华北地区中集合A中的各个产品的销售额。
如果将【地区】对应的维度筛选器设置为上下文筛选器，就可以解决这个问题。此时结果如下：
在这里插入图片描述
这样集合“销售额排名前10的产品”在计算的时候就可以只在华北地区的数据上进行计算。
TIPS:上下文筛选器的执行优先级比维度筛选器、度量筛选器及表计算筛选器高，这里先说维度筛选器是为了方便引入上下文筛选器。