数据仓库建模方法论
通过上一篇数据仓库建设的全局概览,我们认识了数据仓库,也明确了数据建模在仓库建设中的核心地位,数据仓库模型是整个大厦的基石,也是个难点。这么重要的环节就有必要单独拿出来详细说明一下。(本文的重点是维度建模)
1 什么是数据模型
数据模型是抽象描述现实世界的一种方法,是通过抽象的实体及实体之间的联系来表示现实世界中事务的相互关系的一种映射。
数据仓库模型是数据模型中针对特定的数据仓库应用系统的特定模型。由下图四部分内容组成:
l 业务建模,主要解决业务层面的分解和程序化。
l 领域建模,主要对业务模型进行抽象处理,生成领域概念模型。
l 逻辑建模,主要将领域模型的概念实体以及实体之间的关系进行数据库层次的逻辑化。
l 物理建模,主要解决逻辑模型针对不同关系型数据库的物理化以及性能等一些具体的技术问题。
2 数据仓库数据模型架构
数据仓库模型由五部分组成,如下图:
系统记录域:数据仓库业务数据存储区,模型保证了数据的一致性。(继续使用Oracle?)
内部管理域:也就是元数据模型的存储管理。(工具待定)
汇总域:系统记录域的汇总数据,数据模型保证的主题分析的性能,满足部分报表查询。
分析域:用于各个业务部分的具体的主题分析。也就是数据集市。
反馈域:针对前端反馈的数据,根据业务需求而定。
3 数据模型的作用
l 进行全面的业务梳理