总述:
维度模型是一种趋向于支持最终用户对数据仓库进行查询的设计技术,是围绕性能和易理解构建的。尽管关系模型对于事务处理系统表现非常出色,但它并不是面向最终用户的。
事实和维度是两个维度模型中的核心概念。事实表示对业务数据的度量,而维度是观察数据的角度。事实通常是数字类型的,可以进行聚合和计算,而维度通常是一组层次关系或描述信息。维度模型按照业务流程领域即可,例如进货、销售、库存、进货等。不同主题域可能共享某些维度,为了提高数据操作的性能和数据一致性,需要使用一致性维度。
1、维度数据模型建模过程
维度模型通常以星型模式构建。星型模式,是以一个事实表为中心,周围围绕着多个维度表。还有雪花模式,对维度做进一步规范化后形成的。
构建维度模型的四个步骤:1、选择业务流程,2、声明粒度,3、确认维度,4、确认事实
1、选择业务流程:确认哪些业务流程是数据仓库应该覆盖的,描述需要建模的业务流程。
2、声明粒度:粒度用于确定事实中表示的是什么。在一个事实所对应的所有维度设计中强制实行粒度一致性是保证数据仓库应用性能和易用性的关键。从给定的业务流程获取数据时,原始粒度是最低级别的粒度。建议从原始粒度数据开始设计,因为原始记录能满足无法预期的用户查询。汇总后的数据粒度对优化查询性能很重要,但这样的粒度不能满足对细节数据的查询需求。不同事实可以有不同粒度,但是同一事实中不要混用多种不同粒度。
3、确认维度:维度的粒度必须和第二步所声明的粒度一致。维度表是事实表的基础,也说明了事实表的数据是从哪里采集来的。典型的维度都是名词。
4、确认事实:识别数字化的度量,构成事实表的记录。它是和系统的业务用户密切相关的,因为用