数据仓库的设计理念
概念
事实表
- 在多维仓库中,保存度量值的详细值或事实的表成为“事实表”, 例如每一条的订单信息, 这条信息也可能包含有采购订单号或者是发票号。
- 事实表中的数据包含了你想从度量信息中读取最底层的明细。
- 事实表的每一列都是一个维度
- 每个数据仓库包含有多个事实数据表
维度表
- 维度表包含有维度的特定成员的特定名称,维度的名称称为 属性
总结
事实表就是你要关注的内容;
维度表就是你观察该事务的角度,是从哪个角度去观察这个内容的。
例如,某地区商品的销量,是从地区这个角度观察商品销量的。事实表就是销量表,维度表就是地区表。
数据库层次
- STG 原始数据层
- 数据在数据平台的落地
- 表结构和原始一致
- 存储周期 需要存储所有数据
- 命名规范 层次_主题_表内容_分表规则
- ODS 数据操作层
- 过滤掉不用的字段,脏数据处理
- 命名规范 层次_主题_表内容_分表规则
- DWD 公共数据明细
- 屏蔽底层差异, 因为实际开发中 ODS 的数据来源可能很多,要做一个归一化
- DWS 公共数据汇总
- 数据进行基于维度的合并, 支撑业务的开发, 例如推荐统计需求
- ADS 应用数据层
- 经过计算业务的处理,提供给上层应用使用