Tableau刷新数据源
1、连接类型
如果连接的数据源已经修改,通过在“数据”菜单中选择该数据源,然后选择“刷新”,可以使Tableau Desktop立即对这些更改进行更新
但并非每个连接的行为方式都相同。有三种主要连接类型:“实时连接”、“数据提取”和“发布的数据源”。连接的类型由“数据”窗格中数据源旁边的图标指明
1)实时连接
实时连接将查询发送到数据库,并根据结果更新视图。但是,所查询的特定字段是在最初创建连接时定义的。刷新数据源将更新任何新的或更改的字段
2)数据提取
刷新数据提取将查询从中创建数据提取的数据源,并重建数据提取。此过程可能需要一段时间,具体取决于数据提取的大小
3)发布的数据源
连接到发布的数据源时,数据源可能为实时连接或数据提取。选择“数据源”选项卡将显示发布的数据源是实时连接还是数据提取。 如果数据源是数据提取,则所有数据提取刷新都由Tableau Server管理,并且只能由服务器刷新
2、实时连接与数据提取
实时连接与数据提取是最常用的两种连接方式。它们之间的区别在于
- 实时连接:Tableau直接从数据源获取查询结果,本身不存储源数据
- 数据提取:将数据提取到Tableau数据引擎中,由Tableau进行管理
数据提取是与原始数据集分开保存的信息子集。它有两个目的:提高性能以及利用原始数据中可能不可用或不支持的Tableau功能。通过创建数据提取,我们可以通过应用筛选器和设置其他限制来有效减少总体数据量
创建数据提取后,可以使用原始源中的最新数据对其进行刷新。在刷新过程中,可以灵活地选择完全刷新(替换数据提取中的所有现有内容)或增量刷新(仅包括自上次刷新以来的新行)
相较于实时连接,数据提取有以下优点:
-
处理大型数据集:数据提取可以处理大量数据,甚至达到数十亿行。这使用户能够有效地处理大量数据集
-
改进的性能:与直接连接到原始数据的视图相比,与利用提取数据源的视图进行交互可以带来更好的性能。数据提取可优化查询性能,从而加快数据分析和可视化速度
-
增强的功能:数据提取提供对原始数据源可能不可用或不支持的其他Tableau功能的访问。例如,用户可以利用数据提取来计算“计数(不重复) ”,从而实现更高级的计算和分析
-
脱机数据访问:数据提取允许脱机访问数据。这意味着即使原始数据源不可用,用户仍然可以在本地保存、操作和使用数据
以下是实时连接与数据提取两种连接方式的使用场景:
1)实时连接场景
- 源数据库性能优越:IT基础设施支持快速数据分析,那么不建议进行数据复制
- 数据的实时性要求高:需要使用实时更新的数据进行分析,则不建议使用数据提取的方式
- 数据的保密要求高:出于信息安全考虑不希望将数据保存在本地,则不建议进行数据提取
2)数据提取场景
- 源数据库的性能不佳:源数据库的性能跟不上分析速度的需要,则可以由Tableau的数据引擎来提供快速交互式分析
- 需要脱机访问数据:如果需要在差旅途中脱机访问数据,则可以将相关数据提取到本地
- 减轻源系统的压力:如果源系统是重要的业务系统,那么建议将数据访问转移到本地,以减轻对源系统的压力
3、数据刷新
如果从数据源的基础数据中移除了Tableau工作表中使用的某个字段,然后刷新数据源,将显示一条警告消息,指示将从视图中移除该字段,由于缺少了该字段,工作表将无法正确显示
如果基础数据发生更改,例如,如果添加新字段或行、更改数据值或字段名称或者删除数据,则在您下次连接数据源时Tableau将反映这些更改
但是,由于Tableau Desktop查询数据而不导入数据,因此可以在不断开连接的情况下即时刷新Tableau数据源以反映数据修改
1)实时连接与数据提取数据刷新
官方文档参考:https://help.tableau.com/current/pro/desktop/zh-cn/refreshing_data.htm
2)发布的数据源刷新
官方文档参考:https://help.tableau.com/current/online/zh-cn/to_keep_data_fresh.htm