【数据立方】数据立方体的有效计算、物化materialization,索引OLAP数据

一、数据立方体的有效计算

多维数据分析的核心是有效计算多个维度合上的聚集。按SQL术语,这些聚集称为group-by。

对于n维的立方体,包括基本立方体总共有(2的n次幂)个方体。(假设每个维没有分层)

curse of dimensionality 如果数据立方体中所有的方体都预先计算,所需的存储空间可能爆炸。

二、物化materialization

部分物化

冰山立方体:是一个数据立方体,它只存放其聚集值(如计数)大于某个最小支持度阈值的立方体单元。

一旦选定的方体已经物化,重要的是在查询处理时利用它们。

三、索引OLAP数据

大部分数据仓库系统支持索引结构和物化视图(使用方体)。

位图索引,连接索引,位图连接索引

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值