专业数据仓库面临的一个问题是数据仓库中数据库设计的基本模型选取问题。广泛采用的数据库设计模型有两种,关系型和多维型。
下面介绍两种模型,及其两种方法的区别和在数据仓库中的应用,两种方法的优缺点。在建立数据仓库过程中,对于数据库设计而言,建立关系型数据库是最佳的长期的方法,并且这种情况需要真正的企业方法。多维模型有利于短期数据仓库,但这种方法使用的数据仓库的范围有限。
一、关系模型
二、多维模型
三、两种模型的区别
一、关系模型
关系型数据库设计首先要创建一张数据表,表中每一行包含不同的列。关系表可以包含不同的属性,每一数据列表示不同的物理特征。不同的列可以索引并作为标识符。部分列在执行过程中可以为空。所有列都是根据数据定义语言(DDL)标准定义的。关系型数据以一种称为“标准化”的形式存在。数据标准化是指数据库设计会使数据分解成非常低的粒度级。标准化的数据以一种孤立模式存在,这种情况下对数据表里的数据关系要求很严格。当进行标准化的时候,表中的数据只能与这张表里的其他数据关联。
通过关系模型产生的数据仓库的设计是很灵活的。基于设计的数据库起初可以是一种方式,当根据关系模型设计后又形成另一种形式。数据元可以以多种方式重新赋值。灵活性是关系模型最大的优势,其次是功能性。因为细节数据需要被收集到一起并且能够结合,因此给予关系模型的数据仓库的设计可以支持数据的多种视图。
二、多维模型
星形连接:
多维模型方法也叫星形连接。
数据库设计多维模型方法的中心是星形连接,之所以称为星形连接,是因为它的表示方法是以一颗“星”为中心,周围围绕着其他数据结构。即星形连接的中心是一张事实表。事实表是包