星型模型和olap多维数据库
在关系数据库管理系统中实现的维度模型称为星型模型,在多维数据库环境中实现的维度模型通常称为联机分析处理olap。
用于度量的事实表
维度模型中的事实表存储组织机构业务过程事件的性能度量结果。“事实”这一术语表示业务度量。事实表中的每一行表示一个度量事件,每行中的数据是一个特定级别的细节数据,称之为粒度。维度建模的核心原则之一,同一事实表中的所有度量行都是相同的粒度。
物理世界的每一个度量事件与对应的事实表行具有一一对应的关系,这是维度建模的基本原则。
最实用的事实是数值类型和可加类型事实,例如,美元销售额。可加性是至关重要的,bi常见是检索多行的结果,不太可能一行。
事实通常以连续值描述,如此有助于区分是事实还是维度的问题。
所有事实表的粒度可划分为三类:事务,周期型快照和累积快照。
当事实表中的外键与对应所有维度表中的主键正确匹配时,称之为满足参照完整性。
用于描述环境的维度表:维度表是事实表不可或缺的组成部分,维度表包含与业务过程度量事件有关的文本描述。
维度表的属性在DW/BI系统中起到了至关重要的作用,因为维度表的属性是所有查询约束和报表标识的来源。
强大的维度属性带来的回报是健壮的分片-分块分析能力。
维度提供数据的入口点,提供所有的DW/BI分析的最终标识和分组。
注意:一个数字量到底是事实还是维度属性,对设计者来说是个两难的问题,一般认为连续的数字量是事实属性,离散不连续的是维度属性。
粒度最小的数据或者原子数据具有最多的维度,尚未聚积的原子数据是最具表达性的数据。
Kimball维度建模技术
1、收集业务需求与数据实现
2、协作维度建模研讨
3、4步骤维度建模设计过程
(1)选择业务过程
(2)声明粒度
(3)确认维度
(4)确认事实
4、业务过程
业务过程是组织完成的操作活动
5、粒度
粒度就是事实统计的频率(例如按年月日,按不同部门等)
6、描述环境的维度
7、用于度量的事实