1.数据立方体的概念和计算。
- 数据立方体: 数据立方体只是多维模型的一种形象的说法,它只有三维,但多维数据模型不仅限于三维,它可以是n维的。之所以这么叫是为了让用户更容易想象,方便解释和说明,同时也为了和传统的关系数据库中的二维表进行区分。
- 完全物化是指计算数据立方体格中的所有方体;部分物化是指选择性的计算格中方体单元的子集。冰山立方体和外壳片段都是物化的例子。冰山立方体是一种数据立方体,它仅存储其聚集值(如count)大于某最小支持度阈值的立方体单元。
- 数据立方体的计算: (1)多路数值聚集Multiway,基于稀疏数组的、自低向上的、共享计算的物化整个数据立方体;(2)BUC,通过探查有效的自顶向下计算次序和排序计算冰山立方体;(3)Star-Cubing,使用星树结构,集成自顶向下和自低向上计算,计算冰山立方体;(4)外壳立方体,通过仅预计算划分的立方体外壳片段,支持进行高维OLAP.