一.范式建模和维度建模
A.维度建模:数据可以抽象成事实和维度,维度为观察事物的角度,事实为某粒度下的度量值,维度建模一般如下:
1.选择业务过程
2.声明粒度:
3.确认维度:
4.确认事实:
维度建模一般有,星型模型,雪花模型,星座模型
B.范式建模(关系建模):设计一张数据表的表结构,符合标准级别,规范要求。主要是用于OLTP
优势是降低冗余性,节约存储。
劣势是使用上不方便,在大规模数据时候,进行跨表关联查询,会造成冗余。
1.第一范式:属性不可切割
2.第二范式:不能存在部分函数依赖
3.第三范式:不能存在传递函数依赖
数据仓库分层:
ODS:保存原始数据的,对原数据不做处理
DWD:对ods层数据进行清洗,维度化,脱敏
DWS:以dwd为基础,按天进行汇总
DWT:以dws为基础,按主题汇总
ADS:为各种统计报表提供数据