数仓 —— 数据仓库模型层级设计

本文探讨了数据仓库与数据库的区别,并详细介绍了数据仓库的分层设计,包括ODS(操作数据层)、DWD(主题明细层)、DWS(主题聚合层)、ADS(应用数据层)和DIM(维度数据层)。每个层级的作用和功能被阐述,例如ODS层的数据清洗和结构化,DW层的维度退化和复用逻辑,以及ADS层面向分析的构建。数据仓库分层带来的好处包括清晰数据结构、减少重复开发、统一数据口径以及复杂问题简单化。
摘要由CSDN通过智能技术生成

数仓 —— 数据仓库模型层级设计

提到数据仓库,我们可能会想到跟它相近的数据库,那么两者区别在哪里,不同阶段业务数据该怎么设计数仓,以及使用数仓有哪些好处。

各团队对数据模型都有不同的分层方式,比如我们现在在用的:
ODS(操作数据层),DWD(主题明细层),DWS(主题聚合层),ADS(应用数据层),DIM(维度数据层)

( 一 ) 数据仓库与数据库

( 二 ) 数据仓库层级设计

在这里插入图片描述

  1. ODS层
    最接近数据源的一层,一般会负责以下工作:
    1)数据清洗:过滤日志或者上游中的脏数据;
    2)结构化:将数据中的json等非结构化字段结构化处理;
    3)保留原始数据:根据业务或者系统要求保留历史切片,方便溯源。
  2. DW层
    DW是数仓设计的核心层,又可细分为:DWD(Data Warehouse Detail)层、DWM(Data WareHouse Middle)层和 DWS(Data WareHouse Servce) 层。
    按主题建模
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值