基本概念:
- 基本单元:基本方体的单元
- 聚集单元:非基本方体的单元
- 冰山立方体:部分物化的立方体
- 最小支持度(最小支持度阀值):部分物化的最小阀值(说白了就是限定了一个范围)
∵冰山立方体仍有大量不感兴趣的单元需要计算
∴引入——闭覆盖——一个单元没有后代或者它的后代的度量值与其不同
法2:只预计算涉及少数维的立方体,这些方体形成的数据立方体的立方体外壳
- 计算的一般策略:四种优化技术
1. 排序、散列和分组
2. 同时聚集和缓存中间结果
3. 当存在多个子女方体时,由最小的子女聚集
4. 先验剪枝法
—————————————————————————————————————————————————————————————————————————————
数据立方体的计算方法
- 多路数组聚集
计算以2-D平面为例:
维的大小:A——40;B——400;C——4000
1. 扫描次序为1~64
2. 扫描次序为1,17,33,49,5,21,37,53
特点:
1. 数组可以直接寻址
2. 将表转换成数组,用数据计算立方体,然后再把结果转换成表。(当然这并不意味着慢)