数仓分层及命名规范

一、分层

1、ODS层

原始数据层,存放原始数据,直接加载原始日志、数据,数据保持原貌,不做任何处理。

2、DWD层

对ODS层进行清洗,比如处理里面的空值、脏数据、极限值

3、DWS层

对DWD层进行join 或者聚合、汇总操作

4、ADS层

为各种统计报表提供数据

二、分层优点

1、把复杂问题简单化

将一个复杂的任务分解成多个步骤来完成,每一层只处理单一的步骤,比较简单、并且方便定位问题。

2、减少重复开发

规范数据分层,通过的中间层数据,能够减少极大的重复计算,增加一次计算结果的复用性。

3、隔离原始数据

不论是数据的异常还是数据的敏感性,使真实数据与统计数据解耦开。

三、命名规范

ODS层命名为ods前缀

DWD层命名为dwd前缀

DWS层命名为dws前缀

ADS层命名为ads前缀

维度表命名为dim前缀 ,如地域维度、时间维度

每日全量导入命名为df (day full)后缀

每日增量导入命名为di (day increase)后缀

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值