1.维度建模的四个步骤:
确定业务过程
声明粒度
确定维度
确定事实
2.事实表:
(1)事务事实表
单事务事实表
多事务事实表(描述多个业务过程)
(2)周期快照事实表(状态度量,账户余额等)
1)统计的是间隔周期内的度量统计,如历史至今、自然年至今、季度至今等等
2)周期快照表没有粒度的概念,取而代之的是周期+状态度量的组合,如历史至今的订单总数
3)事实事务表是稀疏表,周期快照表是稠密表
稀疏表:当天只有发生了操作才会有记录
稠密表:当天没有操作也会有记录,便于下游使用
(3)全量快照事实表
对于状态一直变化的数据,用全量快照表统计至今最新的状态,如订单评价,好中差评会每天变化,事实表的粒度确定为每一条评价,加之冗余常用维表属性
(4)累积快照事实表
|日期一|日期二 |日期三
|-12:01-|–|
| 12:01 |14:25 |
|12:01 | 14:25 | 17:56
3.数据、数据元素、数据项、数据对象的理解
假设有两张表,A表为人员表,B表为课程表, 表的格式如下:
这两张表就是数据
而单独的一张表就称为数据对象,即人员表是一个数据对象,课程表也是一个数据对象
而每张表中的每一行就称为数据元素
而姓名,性别,身高,课程代号,课程名就称为数据项