冰山立方体是部分物化的方体。
这里我们先了解部分物化的概念:有选择地计算整个可能的方体集中一个适当的子集。我们可以计算数据立方体的一个子集,它只包含满足用户指定的某种条件(如每个单元的元组计数大于某个阈值)的那些单元。
举例说明,这句话的意思就是部分物化包含了两种情况,如果我们只计算3-D方体ABC而不计算4-D方体ABCD就属于第一种情况,比如立方体外壳;如果我们只计算方体ABC中的一部分单元则属单元于第二种情况,比如冰山立方体。
如果共享维上的聚集值不满足冰山条件,则沿该维向下的所有单元也不可能满足冰山条件。这样的单元和他们的后代都可以被剪枝。
也就是说:如果A维上的某些聚集值a1不满足条件,则沿该维向下的例如AC中a1c1,a1c2,a1c2这些单元都不满足冰山条件被剪枝。其余的a2c1,a2c2,a2c3可能满足而留下。如果共享维的值为a1,并且它不满足冰山条件,则以a1CD/a1为根的整颗子树(包括a1CD/a1C、a1D/a1、a1/a1)都可以被剪枝,因为他们都是a1的更特殊化的版本。
下面是Star-Cubing:使用动态星树结构计算冰山立方体
- 星树创建:*代替维上不满足冰山条件的属性值