python tableau工作流_提取数据

数据提取是保存的数据子集,您可以使用这些数据子集来改善性能,或利用原始数据中没有或不支持的 Tableau 功能。在创建数据的数据提取时,您可以通过使用筛选器和配置其他限制来减少数据总数。创建数据提取后,可使用原始数据中的数据对其进行刷新。在刷新数据时,您可以选择进行完全刷新(这样做将会替换所有数据提取内容),或者可以执行增量刷新(这样做仅会添加自上次刷新以来新增的行)。

数据提取具有优势的一些原因:

支持大型数据集:您可以创建包含数十亿行数据的数据提取。

快速创建:如果您使用大型数据集,则创建和使用数据提取可能比使用原始数据更快。

帮助提高性能:当您与使用数据提取数据源的视图交互时,你所体验到的性能通常比基于原始数据连接与视图交互时所体验到的性能更好。

支持附加功能:数据提取允许您利用原始数据无法可用或不支持的 Tableau 功能,例如不重复计数计算功能。

提供对数据的离线访问权限:当原始数据不可用时,数据提取允许您在本地保存和处理数据。例如,当您旅行时

数据提取的最新更改

随着 2020.2 版中 Tableau 数据模型中的逻辑表和物理表的引入,数据提取存储选项已从单个表和多个表更改为逻辑表和物理表。这些选项更好地描述了如何存储数据提取。有关详细信息,请参见决定应以何种方式存储数据提取数据。

从版本 10.5 开始,当您创建一个新的数据提取时,它将使用 .hyper 格式。.hyper 格式的数据提取利用了改进的数据引擎,此引擎针对更大的数据集支持更快的分析和查询性能。

同样,使用版本 10.5 及更高版本对 .tde 数据提取执行数据提取相关任务时,数据提取会升级到 .hyper 数据提取。在 .tde 数据提取升级为 .hyper 数据提取后,它不能恢复为 .tde 数据提取。有关详细信息,请参见数据提取升级为 .hyper 格式。

视图中值和标记的变化

为了提高数据提取效率和可扩展性,可以在版本 10.5 及更高版本中以不同方式计算数据提取中的值(与版本 10.4 及更低版本相比)。更改计算值的方式可能会影响视图中标记的填充方式。在某些极少数的情况下,更改可能会导致视图形状发生变化或变为空白。这些更改可能也适用于多连接数据源、使用文件数据实时连接的数据源、连接到 Google Sheets 数据的数据源、基于云的数据源、纯数据提取数据源以及 WDC 数据源。

若要了解使用版本 2020.4 后您可能会在视图中看到的某些差异,请查看以下各部分。

日期和日期时间值的格式

在版本 10.5 中及更高版本中,数据提取将遵循关于如何通过 DATE、DATETIME 和 DATEPRASE 函数解释日期字符串的更加一致和严格的规则。这会影响日期的解析方式,或者这些函数所允许的日期格式和模式。更具体地说, 规则可以概括如下:

计算日期,然后按列进行分析,而不是按行进行分析。

计算日期,然后根据创建工作簿所在的位置的区域设置进行分析,而不是根据打开工作簿所在的计算机的区域设置进行分析。

这些新规则使数据提取更加高效,并能生成与商业数据库一致的结果。

但是,由于存在这些规则,特别是在创建工作簿时的区域设置与打开工作簿时的区域设置或工作簿所发布到的服务器的区域设置不同时,您可能会发现 1.) 日期和日期时间值更改为不同的日期和日期时间值,或者 2.) 日期和日期时间值更改为 Null。当日期和日期时间值更改为不同的日期和日期时间值或者变为 Null 时,通常表示基础数据存在问题。

为什么使用版本 10.5 和更高版本后您可能会在数据提取数据源中看到日期和日期时间值发生变化,以下是一些常见的原因。

日期/日期时间值发生变化的常见原因

Null 值的常见原因

当函数必须在单个列中解析多种日期格式时。如果日期不确定并且可以用多种不同方式进行解释,则会根据 Tableau 为该列确定的格式来解释日期。有关一些示例,请参见以下日期方案 1和日期方案 2。

当函数必须解析 YYYY-MM-DD (ISO) 格式时。有关示例,请参见日期方案 3。

当函数没有足够的信息来推导时间时,它可能会将值解释为“00:00:00.0”,并使用“0”来表示小时、分钟、秒和毫秒。

当函数没有足够的信息来推导时间时,它可能会将月份值解释为“1”或“一月”。

当函数解析年份时,会按以下方式解释年份:年份“07”被解释为“2007”

年份“17”被解释为“2017”。

年份“30”被解释为“2030”。

年份“69”被解释为“2069”。

年份“70”被解释

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值