dbt-bigquery 项目教程

最新推荐文章于 2024-10-10 08:49:39 发布

戴策峥Homer

最新推荐文章于 2024-10-10 08:49:39 发布

阅读量273

点赞数 4

本文链接：https://blog.csdn.net/gitblog_00720/article/details/142163665

版权

dbt-bigquery 项目教程

dbt-bigquery dbt-bigquery contains all of the code required to make dbt operate on a BigQuery database. 项目地址: https://gitcode.com/gh_mirrors/db/dbt-bigquery

1. 项目介绍

dbt-bigquery 是 dbt（数据构建工具）的一个插件，专门用于与 Google BigQuery 数据库进行交互。dbt 是一个开源工具，允许数据分析师和工程师使用类似于软件工程师构建应用程序的实践来转换数据。dbt 是 ELT（提取、加载、转换）流程中的 "T"，帮助用户在数据仓库中组织、清洗、去规范化、过滤、重命名和预聚合数据，使其准备好进行分析。

dbt-bigquery 包包含了所有使 dbt 能够与 Google BigQuery 一起工作的代码。通过使用 dbt-bigquery，用户可以在 BigQuery 中执行复杂的数据转换操作，而无需编写复杂的 SQL 脚本。

2. 项目快速启动

安装 dbt-bigquery

首先，确保你已经安装了 Python 和 pip。然后，使用以下命令安装 dbt-bigquery：

pip install dbt-bigquery

配置 dbt 项目

创建 dbt 项目：

在终端中运行以下命令来创建一个新的 dbt 项目：
```
dbt init my_bigquery_project
```

配置 profiles.yml：

在 ~/.dbt/profiles.yml 文件中添加以下配置：

my_bigquery_project:
  target: dev
  outputs:
    dev:
      type: bigquery
      method: service-account
      project: [GCP_PROJECT_ID]
      dataset: [DATASET_NAME]
      threads: 4
      keyfile: /path/to/service-account.json

编写模型：

在 models 目录下创建一个新的 SQL 文件，例如 my_first_model.sql：
```
SELECT *
FROM `my_bigquery_project.my_dataset.my_table`
```
运行 dbt：

在终端中运行以下命令来执行模型：
```
dbt run
```