关于DBT项目
dbt 项目告知 dbt 项目的上下文以及如何转换数据(构建数据集)。根据设计,dbt 强制执行 dbt 项目的顶级结构,如文件、目录、目录等。在顶级目录中,可以满足组织和数据管道需求的任何方式组织项目。
dbt_project.yml
models
snapshots
至少,项目需要的只是项目配置文件。DBT 支持许多不同的资源,因此项目还可能包括:dbt_project.yml
-
模型 models
每个模型都位于单个文件中,并包含将原始数据转换为可供分析的数据集的逻辑,或者更常见的是,是此类转换的中间步骤。 -
快照 snapshots
一种捕获可变表状态的方法,以便稍后可以参考它。 -
种子 seeds
CSV 文件包含静态数据,您可以使用 dbt 将其加载到数据平台中。 -
测试 tests
可以编写的 SQL 查询来测试项目中的模型和资源。 -
宏 macros
可以多次重用的代码块。 -
文档 docs
您可以生成的项目文档。 -
来源 sources
一种命名和描述通过提取和加载工具加载到仓库中的数据的方法。 -
暴露 exposures
一种定义和描述项目下游使用的方法。 -
指标 metrics
一种为项目定义指标的方法。 -
分析 analysis
一种在项目中组织分析 SQL 查询的方法,例如 QuickBooks 中的总账。
在构建项目结构时,应考虑对组织工作流的以下影