数据仓库建设--OLAP和数据立方体技术

本文介绍了数据仓库中OLAP工具使用数据立方体和多维数据模型,通过立方体物化提升查询效率。讨论了完全立方体与部分立方体物化的策略,包括冰山立方体和闭立方体。详细阐述了数据立方体计算的基本概念,如立方体物化、部分物化以及闭覆盖,并探讨了数据立方体计算的一般策略和方法,如多路数据聚焦、BUC算法和外壳片段方法,旨在优化OLAP性能和存储需求。
摘要由CSDN通过智能技术生成

    OLAP工具通常使用数据立方体和多维数据模型,对汇总数据提供灵活的访问。例如:数据立方体能够存放多个数据维上的预计算的度量。用户可以提出数据上的OLAP查询,也可以以多维方式,通过诸如下钻或上卷这样的OLAP操作类探查数据。

一、数据立方体计算:基本概念

    为了提升OLAP查询效率,我们采用了完全立方体物化(预计算)与部分立方体物化。下面比较了这些策略。

1、立方体物化:完全立方体、冰山立方体、闭立方体和立方体外壳

    例如:维A、B、C和聚集度量M的3-D数据立方体。通常使用的度量包括count(),sum(),min(),max()。数据立方体是方体的格,每个方体代表一个group-by。基本方体是数据立方体中泛化程度最低的方体。泛化程度最高的方体是顶点方体。为了在数据立方体中下钻,我们从顶点方体的格向下移动;对于上卷,我们从基本方体向上移动。

    基本方体的单元是基本单元。非基本方体的单元是聚集单元。

    为了确保快速查询OLAP,有时预计算完全立方体。然而,完全立方体的计算复杂度是维数的指数,即2的n次方。如果考虑到每个维的概念分层,那么方体的个数更多。这样预计算完全立方体可能需要海量空间。尽管如此,完全立方体计

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值