数仓建模
指标:事务型指标,存量型指标,复合指标
数据层:操作数据层,公共纬度模型层,应用数据层,
构建过程
1、高层模型,对产出目标,进行维表和事实表进行图形描述
2、详细模型,对模型进行数据填充
3、验证,再设计
4、出文档
基本原则
1、一致性,字段名等统一
2、命名清晰可理解
3、高内聚低耦合
4、核心模型与扩展模型分离
5、公共处理逻辑下沉及单一
6、成本无性能平衡
纬度设计过程
1、确定主纬表
2、确定相关纬表
3、确定维度属性
维度表类型
维度表处理方法
1、雪花模型的纬度进行反规范化
2、拆分
3、缓慢变化维,处理方式:快照维表,解决缓慢变化维的问题,拉链表
4、递归表处理:进行扁平化处理,层次桥接表
5、微型纬度
6、行为纬度
7、多值纬度
8、多值属性
9、杂项纬度
纬度设计过程
1、选择业务过程确定事实表
2、声明粒度
3、确定纬度
4、确定事实
5、冗余纬度降维
事实表设计
1、事务事实表:单事务事实表,多事务事实表
2、周期快照实时表
3、积累快照事实表