数据仓库维度建模步骤

在商业智能项目的实施过程中,维度建模技术和企业数据仓库建模是两种不同的方法论,以下是以应用驱动、提供快速原型的商业智能项目的实施和规划过程中使用的维度建模方法时的标准实施过程。具体到项目中则根据项目的规模及所涉及的业务范围而有所补充或裁减。

1. 商业智能项目规划

a) 数据仓库项目的定义及范围
b) 项目准备评估
c) 业务合理性证明

2. 商业智能项目业务需求定义

a) 业务需求收集
b) 业务需求审查
c) 数据审计

3. 数据仓库逻辑设计

3.1. 维度建模

维度建模是一种逻辑设计技术,该技术试图采用某种直观的标准框架结构来表现数据并且允许高性能存取
优点:
a) 维度建模是可预测的标准框架。允许数据库系统和最终用户查询工具在数据方面生成强大的假设条件,这些数据主要在表现和性能方面起作用。
b) 星型连接模式的可预测框架能够忍受不可预知的用户行为变化。
c) 具有非常好的可扩展性,以便容纳不可预知的新数据源和新的设计决策。可以很方便在不改变模型粒度情况下,增加新的分析维度和事实,不需要重载数据,也不需要为了适应新的改变而重新编码。较好的扩展性意味着以前的所有应用都可以继续运行,并不会产生不同的结果。

3.2. 定义数据仓库总线结构

a) 业务驱动维度建模
b) 数据仓库总线结构矩阵
c) 一致性维度
d) 一致性事实
一致性维度和一致性事实是数据仓库的“总线”
e) 单元数据集市
购货订单,装船,付款等,来源于单个事务
f) 多元数据集市
客户利润率,其中描述收益的传统源必须与描述成本的传统源组合在一起使用。来源于多个事务,应该从单元数据集市开始创建数据集市。
g) 事务模式数据集市
h) 周期快照数据集市
i) 累计快照数据集市

3.3. 定义高级数据模型逻辑图

3.4. 维度模型的设计过程

a) 选取业务处理
b) 定义粒度
c) 选定维度
d) 确定事实

3.5. 源数据-目标数据映射

即ETL规则定义,设计数据仓库与数据源之间的逻辑映射与转换关系。
a) 维度表映射
b) 事实表映射

3.6. 产出文档

a) 数据仓库总线结构文档
b) 高级数据模型文档
c) 数据模型及ETL设计文档

4. 数据仓库物理设计

4.1. 创建物理数据模型

a) 选择数据建模工具
b) 物理数据结构的设计

4.2. 制定最初的索引计划

a) 为事实表创建索引
b) 为维度表创建索引

4.3. 设计和创建数据库实例

a) 保存数据库创建脚本和参数文件
b) 创建物理存储结构

4.4. 数据仓库物理设计产出文档

a) 数据模型设计文档
b) 数据库创建脚本文档
c) 数据库初始化脚本文档
d) 在数据模型及ETL设计文档中加入相关部分的设计内容

5. ETL设计与开发

5.1. 维度表装载设计

5.2. 事实表装载设计

5.3. 聚合表和多维联机分析处理装载

5.4. 数据仓库的操作与自动化

数据仓库操作都是在非公开方式下定期执行装载处理。

5.5. 产出文档

a) 项目开发文档
b) 在数据模型及ETL设计文档中加入相关部分的设计内容

6. 多维数据集开发

6.1. 数据集市定义

a) 维度定义
b) 度量值组定义
c) 计算成员定义

6.2. 数据透视定义

根据用户应用需求将多个度量值组组合在一起,定义出一个多维数据集的子集。

6.3. 产出文档

a) OLAP 多维数据集项目开发文档
b) OLAP 多维数据集业务说明文档

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值