数仓 —— 数据仓库模型层级设计
提到数据仓库,我们可能会想到跟它相近的数据库,那么两者区别在哪里,不同阶段业务数据该怎么设计数仓,以及使用数仓有哪些好处。
各团队对数据模型都有不同的分层方式,比如我们现在在用的:
ODS(操作数据层),DWD(主题明细层),DWS(主题聚合层),ADS(应用数据层),DIM(维度数据层)
( 一 ) 数据仓库与数据库
( 二 ) 数据仓库层级设计
- ODS层
最接近数据源的一层,一般会负责以下工作:
1)数据清洗:过滤日志或者上游中的脏数据;
2)结构化:将数据中的json等非结构化字段结构化处理;
3)保留原始数据:根据业务或者系统要求保留历史切片,方便溯源。 - DW层
DW是数仓设计的核心层,又可细分为:DWD(Data Warehouse Detail)层、DWM(Data WareHouse Middle)层和 DWS(Data WareHouse Servce) 层。
按主题建模