“我是Tableau手册的深度解说家,而非官方文档的搬运工。” 原创作品,欢迎分享,禁止抄袭。
在大数据分析过程中,我们会频繁的遇到需要把数据结合到一起的情形;在Tableau中,数据联结在一起有多种方式;而在合适的地方选择合适的方法,是确保数据准确和性能的基础。
一、三种联结方式与数据并集(复习)
1、三种连接方式
在具体展开之前,我们先统一一下概念,我用“数据联结”(Data Connect)代表最为广义的统称,意指把来自不同数据源的数据结合在一起。在Tableau中,根据不同的合并方式和数据处理阶段,使用了不同的用词,其一是Data Union,翻译为“数据并集”,用于相同数据解构的上下追加,其二是Data Join,翻译为“数据连接”,用于有共同连接字段的数据左右相连,其三是Data Blend,翻译为“数据混合”,用于视图层面数据聚合后的联结查询。
这里的关键区别是:并集需要数据结构一致、连接会在行级别增加数据的字段数量、数据混合不会生成新的数据源只是聚合查询。
2、数据连接 Join
举例来说:假定我们有两组数据,它们有共同的标题字段。分析之前,我们想要把两个数据结合在一起。连接有四种方式:查找共同的内容(内连接)、左侧为基准追加右侧数据源的其他字段(左连接)、右侧为基准、重复项同时保留差异(外连接)。用数据库的专业术语,就是:内连接、左连接、右连接和全连接。(有数据库基础的可直接跳过本段)
表的连接是关系型数据库的核心问题。
3、数据混合Bl