在做数据准备时,偶而也会遇到有.csv
文件需要读取的情况,dbt
提供seed
功能读取.csv
文件到数据库。读取后的表,可以使用ref()
方法引用。
测试环境
- dbt 1.5
- 数据库:Postgres 14
准备测试数据
可以使用自己准备的测试.csv
文件。也可以使用 jafgen
包来生成测试数据:
- 执行
pip install jafgen
命令安装jafgen
。 - 安装完成后,执行
jafgen --years 1
会在当前目录下的jaffle-data
目录生成一年的测试数据,包括:raw_customers.csv
客户ID和名称raw_items.csv
商品SKU和order_id关联raw_orders.csv
订单时间、门店ID、总额等raw_products.csv
产品价格和描述raw_stores.csv
门店信息raw_supplies.csv
供应信息
- 将
jaffle-data
目录及文件copy
到<dbt-project>/seeds/
目录下。