数据仓库构建方法

简述维度建模是一种逻辑设计技术,该技术试图采用某种直观的标准框架结构来表现数据,并且允许高性能存取。优点:维度建模是可预测的标准框架。允许数据库系统和最终用户查询工具在数据方面生成强大的假设条件,这些数据主要在表现和性能方面起作用。 星型连接模式的可预测框架能够忍受不可预知的用户行为变化。 具有非常好的可扩展性,以便容纳不可预知的新数据源和新的设计决策。可以很方便在不改变模型粒度情况...
摘要由CSDN通过智能技术生成
  1. 简述

维度建模是一种逻辑设计技术,该技术试图采用某种直观的标准框架结构来表现数据,并且允许高性能存取。

优点:

  1. 维度建模是可预测的标准框架。允许数据库系统和最终用户查询工具在数据方面生成强大的假设条件,这些数据主要在表现和性能方面起作用。
  2. 星型连接模式的可预测框架能够忍受不可预知的用户行为变化。
  3. 具有非常好的可扩展性,以便容纳不可预知的新数据源和新的设计决策。可以很方便在不改变模型粒度情况下,增加新的分析维度和事实,不需要重载数据,也不需要为了适应新的改变而重新编码。较好的扩展性意味着以前的所有应用都可以继续运行,并不会产生不同的结果。

 

  1. 数据仓库总线结构

数据仓库的构建,不是一个步骤就可以建成的,也不可以将它分成孤立的片段进行建造,要使数据仓库能够长期的成功运转,很需要有一种在体系结构上可以按增量方式建造企业数据仓库的方法,当前主流的方法是:数据仓库总线结构。

    1. 数据总线

总线:最初是电力行业的一个旧术语。它是一种公用结构,每个装置都与它连接,并通过它获取电力。计算机上硬件和软件也都有总线概念,正是有了总线标准,计算机的外设才能够在一起工作并且有效地共存,即使它们是在不同时间由不同厂家制作的也可以。

数据仓库总线结构提供了一种可以用于分解企业数据仓库规划任务的合理方法。在体系结构确立阶段的较短时间内,开发团队设计出一整套在企业范围内具有统一解释的标准化维度与事实。这样,数据体系结构的框架就建立起来了。然后,开发团队可以全力以赴的去实现严格依照体系结构进行迭代开发的独立数据中心。随着独立数据中心的使用,它们像积木块一样搭在了一起。一般来说,需要有足够的数据中心才可能为集成的企业数据仓库带来美好的前景。通过数据仓库环境定义标准的总线接口,独立的数据中心就可以由不同的小组在不同的时间进行实现,只要遵循这个标准,独立的数据中心就可以插入到一起并有效地共存。

多维体系结构主要包括后台(Back Room)和前台(Front Room)两部分。后台也称为数据准备区(Staging Area),是MD架构的最为核心的部件。在后台,是一致性维度的产生、保存和分发的场所。同时,代理键也在后台产生。 前台是MD架构对外的接口,包括两种主要的数据集市,一种是原子数据集市,另一种是聚集数据集市。原子数据集市保存着最低粒度的细节数据,数据以星型结构来进行数据存储。聚集数据集市的粒度通常比原子数据集市要高,和原子数据集市一样,聚集数据集市也是以星型结构来进行数据存储。前台还包括像查询管理、活动监控等为了提供数据仓库的性能和质量的服务。

在多维体系结构中,所有的这些基于星型机构来建立的数据集市可以在物理上存在于一个数据库实例中,也可以分散在不同的机器上,而所有这些数据集市的集合组成的分布式的数据仓库。

如下图所示,Adventure Works Cycles的高级总线矩阵。总线矩阵的每一行代表一个业务过程,并且至少定义了一个事实表和相应的维度。通常,总线矩阵的一行会产生几个相关的事实表,由此可以从不同角度跟踪业务过程。订单业务过程可能会

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值