数仓规范随记

数仓分层

以《大数据之路:阿里巴巴大数据实践》中五层(ods/dwd/dws/dim/ads)分类为基础划分,有序列表记录是分层大类,分层大类下的无需列表是分层小类或者说真正落地的:

  1. ods: 近源层/贴源层/数据Stage层
    • stgb: 从业务系统同步过来的原始数据,不保留历史数据
    • stgd: 类似stgb,但利用「拉链表」保留历史数据
  2. dw: 数仓
    • dwd: 数据明细层(Data Warehouse Detail),将相同主题的数据冗余处理,汇集到一张表中,提高可用性「主题宽表」
      • 实际使用中也会在该层进行简单的数据清洗与转滤
    • dwm: 数据中间层(Data WareHouse Middle),对数据做轻度聚合,提升公共指标的复用性
      • 在 DWM 层先计算出多个小的中间表,然后再拼接成一张 DWS 的宽表
    • dws : 数据服务层(Data WareHouse Servce),按照业务划分,生成大宽表,用户后续报表/业务查询、OLAP分析
      • dws层的表实际中需要推送到关系型数据库中,所以dws附带一层
  3. ads: 未启用

命名规范

  • td: table dimension 维度表
  • tm: table master 主数据表
  • tt: table transaction 事实明细表
  • ta: table aggregation 聚合结果表
  • tc: table code 码表
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值