数据挖掘技术--多维数据模型

本文介绍了数据仓库中的多维数据模型,重点讲解了数据立方体的概念,包括星型、雪花型和事实星座模式。此外,还讨论了度量分类、OLAP操作以及数据仓库的体系结构,如上卷、下钻、切片、转轴等操作,并提到了不同类型的OLAP服务器。
摘要由CSDN通过智能技术生成

数据立方体:

 

数据仓库和数据仓库技术基于多维数据模型。这个模型把数据看成数据立方体形式。多维数据模型围绕中心主题组织,该主题是事实表表示。事实是数值度量的。

数据立方体允许以多维数据建模和观察。他是维和事实定义的。

维是关于一个组织想要记录的视角或观点。每个维都有一个表与之相关联,称为维表。

事实表包括事实的名称或度量以及每个相关维表的关键字。

一个n维数据的立方体叫做基本方格。给定一个维的集合,我们可以构造一个方格的格,每个都在不同的汇总级或不同的数据子集显示数据,方格称为数据立方体。

 

数据仓库的概念模型:

多维数据模型是数据仓库的概念模型。

星型(star schema):事实表在中心,周围围绕地连接着维表,事实表含有大量数据,没有冗余。

雪花模式(snowflake schema):是星型模式的变种,其中某些维表是规范化的,因而把数据进一步分解到附加表中。结果,模式图形成类似于雪花的形状。

事实星座(fact constellation):多个事实表共享维表,这个模式可以看成星型模式集,因此称为星系模式(galaxy schema),或者事实星座(factc onstellation)。

 

 

DMQL包括数据仓库和数据集市的语言原语,包括两种原语定义:

立方体定义(事实表)

define cube<cube_name>[<dimension_list>]:<measure_list>

维定义(维表)

define dimension <dimension_name> as

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值