数据仓库已经问世二十多年了,已经成为信息技术基础设施的基本组成部分。一开始的时候,经常陷入什么是数据仓库或什么不是数据仓库这样的混乱或疑惑。后来在实践和查阅资料的过程中,逐渐觉得数据仓库的出现时为了满足对信息而不是对数据的企业需求,是一个能够为企业提供整合的、粒度的、历史的数据的结构。

当前对数据仓库有多种不同的解释和实现方式。例如,有联合数据仓库、主动数据仓库、星型模式数据仓库、数据集市数据仓库等。

然而,对于什么样的结构才是数据仓库适合的。目前存在着多种不同的解释和实现方式。而且每一种实践在构架上都与其他的实现有很大区别,如果走进一个房间,里面联合数据仓库的支持者正在于主动数据仓库的支持者交谈,你也许会听到一些相同的词语,但这些词代表的意思却大相径庭。当两个不同背景的人交谈时,即使使用相同的词语,也不能保证他们彼此能够相互理解。

DW2.0描述了数据仓库几个重要的特征:
  • 数据一旦被置于数据仓库,就有了自己的生命周期。随着数据老化,数据容量会不断增加,并且大多数情况下这种增加时显著的。想要处理访问可能性不断降低的大量数据,就需要一种特定设计i,以免数据仓库的花费巨大,以至于不能有效地使用数据仓库
  • 当既包含结构化数据又包含非结构化数据时,数据仓库是最有效地方法。
  • 主数据的重要性。我们需要的是企业主数据,是从企业级视角理解主数据,需要调节月数据的所有来源并将它们放置在一个能使他们统一、协调工作的环境中
  • 数据仓库是围绕业务需求展开的,这通常会反映在数据模型上。企业中不断变化的业务环境与相对稳定的技术环境之间的矛盾是需要考虑的一个难题
数据仓库包含了整合后的粒状历史数据。如果还有关于数据仓库的奥秘,那就是它包含的数据及时整合的又是粒状的。数据的整合使得企业对数据有一个真正的企业范围级的观察。这样,如果数据是从单一的定义良好的数据源得到,那么就可以从整体而不是局部地观察数据来进行数据分析。因此,使用数据仓库数据来观察整个企业的能力是数据仓库的首要优势,另外,数据的维度——细分的第一层——使得数据十分灵活。由于数据时粒状的,它就可以被一组人员以一种方式考察,而被另外一组人员以另外一种方式考察。粒状数据意味着这仍旧是一组数据——关于真实状况的单一版本。

数据仓库的另外一个优点是它是一个历史数据的集合,数据仓库是存放有价值的数年前的数据的好地方。
就先说到这里了,关于数据仓库,更多详情 http://www.po-soft.com/hi/zhaolihong