Data Warehousing基本表:
- Dimension(维度表): 度量表
- Fact(事实表): 数字表,倾向于更多的行和更少的列
建模四步曲:
- 选取业务处理过程
- 定义业务处理粒度
- 选定维度
- 确定事实
最重要的事情:规范。名称的规范,计算方式的规范.....
在事实表和维度表中,尽量不要使用本身已有的关键字,而使用数字类型的代理关键字。
原因:
- 速度更快
- 可能会存在本身已有的关键字(比如产品SKU)会同时存在多行的情况(缓慢变化维).
退化维度:只有一个维度属性值,比如订单编号,就应该直接放入到事实表中
缓慢变化维(Slowly Changing Dimensions):“基本”保持不变的维度
以产品维度来介绍三种做法:
- 直接修改属性:
优点:快速、方便,适用于更正作用的属性值。
缺点:丢失了历史变化 - 添加维度行:
优点:保持历史变化,不需要变动事实表(一个产品SKU可能对应不同的代理关键字)。
缺点:加速了维度表的膨胀,不能将新属性值同旧事实历史联系起来。 - 添加维度列:
优点&#x