这一章的笔记基本按照原书展开的框架来走,删节的不多。
概述
会对Kimball进行过程的展开、讨论,并给一些非常经典的用例作为理解的切入点。
1. 维度模型设计
维度模型设计一定不能脱离业务需求来设计,需要很强的协作来完成。在维度模型设计期间主要涉及4个主要的步骤:
- 选择业务过程
业务过程事件简历或获取性能度量,并转换为事实表中的事实。过程定义了特定设计目标以及对粒度维度事实的定义。每个业务过程对应企业数据仓库总线矩阵的一行。 - 申明粒度
粒度用于确定某一事实表中的行表示什么。原子粒度是最低级别的力度。针对不同的事实表粒度,要建立不同的物理表,在同一事实表中不要混用多种不同的粒度。
如果想让粒度更加原子化,可以在维度表上填加属性(即建立新列)。 - 确认维度
维度应该包含BI应用所需要的用于过滤及分类事实的描述性属性。作为DW/BI的工作者,其实主要工作都应该放在数据管理和维度表的开发方面。 - 确认事实
一个事实表行与按照事实表粒度描述的度量事件之间存在一对一的关系,因此事实表一一对应物理可观察事件。
2. 事实表基础
可加、半可加、不可加事实:事实表中的数字度量可划分为三类,灵活和有用程度依次递减。完全可加度量可以按照与事实表关联的任意维度汇总;半可加举例比如说差额,非可加的举例比如说比率。要想提高灵活可用性,可以尽可能的在录入非可加