一、数据仓库设计方法论
1、建立数据仓库系统的参考步骤
2、数据仓库系统的生命周期
概括的看,数据仓库系统的生命周期由以下环节组成:
从细节来看,分为以下步骤:
3、建立数据仓库系统的思维模式
(1)、自顶向下
自顶向下模式首先把数据通过ETL汇集到数据仓库中,然后通过复制的方式把数据推进各个数据集市中。优点如下:
- 数据来源固定,保证数据的完整性。
- 数据格式与单位一致,保证跨数据集市分析的正确性。
- 数据集市可以保证有共享的字段。
(2)、自底向上
自底向上模式首先把数据通过ETL汇集到数据集市中,然后通过复制的方式把数据提升到数据仓库中。优点如下:
- 构建数据集市相对简单。
- 可实现快速数据传送。
4、数据仓库数据库的设计步骤
二、概念模型设计
数据仓库的概念模型通常采用信息包图法来设计,要求将信息包图的5个组成部分(名称、维度、类别、层次、度量)全面的描述出来。
1、信息包图法
信息包图定义主题内容和主要性能指标之间的关系,目标是在概念层满足用户需求。信息包图有三个重要对象:指标(度量)