数据仓库建模(Data Warehousing)学习笔记

本文介绍了数据仓库建模的核心概念,包括维度表(Dimension)和事实表(Fact),并详细阐述了建模的四步曲:选取业务过程、定义粒度、选定维度和确定事实。重点讨论了规范的重要性,特别是在使用代理关键字以提升性能和处理缓慢变化维(Slowly Changing Dimensions)的策略,如直接修改属性、添加维度行和维度列。最后,提到了维度角色模仿的概念,解决不同视图中同一维度的呈现问题。
摘要由CSDN通过智能技术生成

Data Warehousing基本表:

  • Dimension(维度表): 度量表
  • Fact(事实表): 数字表,倾向于更多的行和更少的列

建模四步曲:

  1. 选取业务处理过程
  2. 定义业务处理粒度
  3. 选定维度
  4. 确定事实

最重要的事情:规范。名称的规范,计算方式的规范.....

在事实表和维度表中,尽量不要使用本身已有的关键字,而使用数字类型的代理关键字。
原因:

  • 速度更快
  • 可能会存在本身已有的关键字(比如产品SKU)会同时存在多行的情况(缓慢变化维).

退化维度:只有一个维度属性值,比如订单编号,就应该直接放入到事实表中

缓慢变化维(Slowly Changing Dimensions):基本”保持不变的维度
以产品维度来介绍三种做法:

  1. 直接修改属性:
    优点:快速、方便,适用于更正作用的属性值。
    缺点:丢失了历史变化
  2. 添加维度行:
    优点:保持历史变化,不需要变动事实表(一个产品SKU可能对应不同的代理关键字)。
    缺点:加速了维度表的膨胀,不能将新属性值同旧事实历史联系起来。
  3. 添加维度列:
    优点&#x
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值