初次接触数据仓库的朋友,肯定也听过另一个类似的概念:数据集市。很多朋友都心有疑惑,到底这两个有什么关系呢,今天这篇文章来谈一谈。
首先来看一张网上的数据仓库架构图,这是一个从属型数据集市,位于数据仓库的上层。
一、数据仓库和数据集市的概念
数据仓库(Data Warehouse) 是一个面向主题的(Subject Oriented) 、集成的( Integrate ) 、相对稳定的(Non -Volatile ) 、反映历史变化( TimeVariant) 的数据集合用于支持管理决策。
首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;
其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。
数据集市是用来满足特殊用户的应用需求的数据仓库,它们的规模可能达到数百GB。使其成为数据集市的关键是它的使用目标、范围,而非规模大小。数据集市可以理解为是一个小型的部门或者工作组级别的数据仓库。有两种类型的数据集市:
独立型(直接从操作型环境中获取数据):这些数据集市是由特定的工作