官网上第一句话就很清楚的说明:Data blending is a method for combining data from multiple sources.
Blend 是一个用来组合(结合)多个数据源的方法。
Unlike joins, data blending keeps the data sources separate and simply displays their information together.
与关联不同, blend 保持数据源的独立性,同时展示不同数据源的信息。
blend向不同的数据源分别发送查询,tableau将返回的查询结果汇合到同一个级别。
进行blend操作的两个数据源至少要有一个公共字段,如果字段名称不同,但内容相同,我们可以手动定义关联关系,
具体方法为: 点击菜单上“数据”--> "编辑关系“,选择一个数据源作为主数据源,另一个数据源作为辅助数据源,然后自定义手工添加关联关系,如下图所示:其中coffee chain和office city为两个独立的数据源,有相同的所在地省市地区信息。


另一个方法,也可以把一个数据源的字段手动修改名称与另一个数据源相同,如果两个字段重名, tableau可以自动的建立关系。
下面这个图中可以看到有两个链接标志,一个红色,一个为灰色,红色链接表示两个数据源的关联字段,灰色则表示该字段为两个数据源都有的字段,可以作为链接使用,但是目前并没有进行关联。

*可以点此灰色链接图标进行激活,使其变成红色,建立关联关系。

另外还有一点就是:在创建新的工作表的时候,哪个是主数据源,哪个是辅助数据源,不是一成不变的, 要根据数据查询的需要而定义,并不会一直沿袭之前的限定。
*第一个被拉到工作表中的字段所在的数据源就会成为主数据源(重要)
以下为http://Tableau.com上有关blend的视频,需要先注册再观看。左下角可以选择语言。
When to Blend and When to Joinwww.tableau.com

需要注意的是, 既然同时使用多个数据源的数据, 那为什么不用union呢 ? 什么时候该使用blend, 什么时候该使用union呢?
答案是:blend是以主数据源中字段内容为主的,比如统计不同城市中产品市场占有情况, 如,针对以下两个数据源,错误在于只体现出个别地区的市场情况。


原因是每个产品都在多个市场地区进行销售,那么tableau将会根据不同的数据源进行聚合,聚合后,就只剩下美国和加拿大两个地区了。

在这个例子中 ,跨数据库的连接优于blend(混合),使用产品ID进行关联后,同样的字段, 下图才是我们真正需要展示的,不同的产品类别,在不同的市场销售情况。

可以看到, 使用blend和unionn这两种方法进行数据关联, 产生的结果差异还是非常大的, 需要认真规划,在报表制作前要想清楚,什么时候用blend(混合)方式,什么时候用union(联结)的方式进行数据整合。