ARTS第五周:T - dbt projects描述

本文详细介绍了dbt项目的核心组件,包括dbt_project.yml配置文件,以及模型、快照、种子等资源的使用。还涵盖了项目子目录设置和新项目创建的方法。
摘要由CSDN通过智能技术生成

任何dbt项目至少需要一个 dbt_project.yml项目配置文件 ,dbt支持许多不同的资源,因此一个项目可能还包括:

ResourceDescription
models每个模型都位于单独的文件中,并包含将原始数据转换为可供分析的数据集的逻辑,或者更常见的是此类转换的中间步骤。
snapshots一种获取可变表状态的方法,以便稍后可以参考它。
seeds带有静态数据的CSV文件,您可以使用dbt将其加载到数据平台中。
tests

放你编写SQL查询来测试项目中的模型和资源。

macros可以多次重用的代码块。
docs可以生成的项目文档
sources一种命名和描述由提取和加载工具加载到仓库中的数据的方法。
exposures一种定义和描述项目下游用途的方法。
metrics为您的项目定义指标的一种方法。
groups组允许在受限集合中进行协作节点组织。
analysis一种在项目中组织分析SQL查询的方法,例如QuickBooks中的总账。

项目配置 

 每个dbt项目都包含一个名为dbt_project.yml的项目配置文件。它定义了dbt项目和其他项目配置的目录。

编辑dbt_project.yml以设置常见的项目配置,例如:

YAML keyValue description
name项目名称(蛇形命名法)
version项目版本
require-dbt-version限制您的项目只能使用某些dbt Core版本
profiledbt用于连接到数据平台的配置文件
model-paths模型和源文件所在的目录
seed-paths种子文件所在的目录
test-paths测试文件所在的目录
analysis-paths您的分析文件所在的目录
macro-paths宏所在的目录
snapshot-paths快照所在的目录
docs-paths文档块所在的目录
vars

要用于数据编译的项目变量

dbt_project.yml | dbt Developer Hub 

项目子目录

您可以使用dbt Cloud中的Project subdirectory选项来指定git存储库中dbt应该用作项目根目录的子目录。当您在一个存储库中有多个dbt项目,或者希望将dbt项目文件组织到子目录中以便于管理时,这将非常有用。
要在dbt Cloud中使用项目子目录选项,请执行以下步骤:
单击页面右上角的cog图标,然后单击帐户设置。
在“项目”下,选择要配置为项目子目录的项目。
选择页面右下角的“编辑”。
在“项目子目录”字段中,添加子目录的名称。例如,如果您的dbt项目文件位于名为<repository>/finance的子目录中,则输入finance作为子目录。
也可以引用嵌套的子目录。例如,如果您的dbt项目文件位于“存储库”/“团队/财务”中,则输入“团队/财务”作为子目录。注意:在项目子目录字段中不需要前导或尾随/。
完成后单击保存。
配置项目子目录选项后,dbt Cloud将使用它作为dbt项目的根目录。这意味着dbt命令(例如dbt run或dbt test)将对指定子目录中的文件进行操作。如果项目子目录中没有dbt\u project.yml文件,系统将提示您初始化dbt项目。

New projects


您可以创建新项目并与其他人共享这些项目,方法是在托管的git存储库(如GitHub、GitLab和BitBucket)中提供这些项目。
建立与数据平台的连接后,可以在dbt云中初始化新项目并开始开发。或者,从命令行运行dbt init来设置新项目。
在项目初始化期间,dbt在项目目录中创建示例模型文件,以帮助您快速开始开发。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值