数据立方体:
数据仓库和数据仓库技术基于多维数据模型。这个模型把数据看成数据立方体形式。多维数据模型围绕中心主题组织,该主题是事实表表示。事实是数值度量的。
数据立方体允许以多维数据建模和观察。他是维和事实定义的。
维是关于一个组织想要记录的视角或观点。每个维都有一个表与之相关联,称为维表。
事实表包括事实的名称或度量以及每个相关维表的关键字。
一个n维数据的立方体叫做基本方格。给定一个维的集合,我们可以构造一个方格的格,每个都在不同的汇总级或不同的数据子集显示数据,方格称为数据立方体。
数据仓库的概念模型:
多维数据模型是数据仓库的概念模型。
星型(star schema):事实表在中心,周围围绕地连接着维表,事实表含有大量数据,没有冗余。
雪花模式(snowflake schema):是星型模式的变种,其中某些维表是规范化的,因而把数据进一步分解到附加表中。结果,模式图形成类似于雪花的形状。
事实星座(fact constellation):多个事实表共享维表,这个模式可以看成星型模式集,因此称为星系模式(galaxy schema),或者事实星座(factc onstellation)。
DMQL包括数据仓库和数据集市的语言原语,包括两种原语定义:
立方体定义(事实表)
define cube<cube_name>[<dimension_list>]:<measure_list>
维定义(维表)
define dimension <dimension_name> as