1、DDL建表语句
- 表和字段必须有描述信息
- drop表前面加上IF EXISTS判断
- create表前面加上IF NOT EXISTS判断
- 设置合理的生命周期,保证有用的历史数据不被删除,同时避免存储资源浪费
- 使用常见的字段类型 DataTime、Bigint、Double、String,如使用其他字段,需要项目组评估
各层表命名规范:
- ODS层:按业务系统进行分域,如tb_vms_tm_vehicle_h(表类型&主题域_业务系统_源表名_更新频率)
- DWD层:按数据主题进行分域,例如t_sl_tm_vehicle_h(对象类型_[DIM]_一级主题域_二级主题域_表名_更新频率)
- DWS层:按业务主题进行分域,例如t_car_sl_sale_detail_h(对象类型_一级主题域_二级主题域_表名_更新频率)
- ADS层:按业务部门、需求编码进行分域,例如t041_sl_sale_deail_h(对象类型&编号_业务部门_表名_更新频率)
2、统一维度和UDF自定义函数
这一些很重要,如果不在数仓开发前期进行规范和统一,就会出现多个项目