dbt init imdb
以clickhouse官网dbt示例用到的imdb为例子
创建 profiles.yml 文件
用jaffle_shop的图
在配置的profiles.yml和dbt_project.yml中的名字要对应。
target:dbt 项目本身也有分支和环境的区别,现在我们就是学习和测试,所以这里环境可以定义为 dev 即可。
type:你所使用适配器所对应的数据库名称,因为我们使用的是 bigquery,所以这里填 bigquery 即可。
method:固定配置,不用改。
project:项目名,注意是你的项目名,当然也可能叫数据容器名,就是最外层的容器名。
dataset:数据集名称,一般一个数据集下包含多张数据表,所以这个关系就是数据库---数据集--数据表的关系。但需要注意的是,一般数据库有N个数据集,我们操作数据也不可能只操作一个数据集,所以这里的 dataset 只是作为默认值,如果大家有数据库所有权限,还是能查询所有数据集,不过它会影响 dbt seed 数据库新表的创建位置,一般我们 dataset 提供哪,seed 命令创建的新表就在哪。总而言之,不影响查询数据转换,但是影响 seed 和我们 model 新表、视图创建的位置。
threads:用于指定运行 dbt 任务时的并发线程数。使用多个线程,可以加快 dbt 流水线的执行速度,这里我们也默认 4 即可。
keyfile:链接 Google 数据库也需要授权,简单理解就是一份秘钥,因为我的秘钥也直接放在了项目根路径,所以我这里直接引即可。
————————————————
原文链接:https://blog.csdn.net/sdgfafg_25/article/details/134726752
dbt debug检查
run 命令
https://zhuanlan.zhihu.com/p/675471435