数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。与其他数据库应用不同的是,数据仓库更像一种过程,对分布在企业内部各处的业务数据的整合、加工和分析的过程。而不是一种可以购买的产品。狭义的数据仓库层可以看作整个数据仓库建立过程中的一个层次,用于存储各种颗粒的历史数据,一般的建模方式是3NF方式。
数据集市,或者叫做"小数据仓库"。如果说数据仓库是建立在企业级的数据模型之上的话。那么数据集市就是企业级数据仓库的一个子集,他主要面向部门级业务,并且只是面向某个特定的主题。数据集市可以在一定程度上缓解访问数据仓库的瓶颈。对于数据集市而言,一般的建模方式是多维数据模型(以星型模型为主),便于OLAP分析。(对应于上图的数据集市)
联机分析处理(OLAP)的概念最早是由关系数据库之父E.F.Codd于1993年提出的。当时,Codd认为联机事务处理(OLTP)已不能满足终端用户对数据库查询分析的需要,SQL对大数据库进行的简单查询也不能满足用户分析的需求。用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。因此Codd提出了多维数据库和多维分析的概念。OLAP分析是建立在多维数据模型基础上的。根据多维数据存储方式的不同又分为ROLAP和MOLAP方式。常用的OLAP服务器有Informix Metacube、Microsoft SQL Server OLAP Services、oracle OLAP Services(ROLAP); Hyperion Essbase(MOLAP
多维数据模型上的OLAP操作(对应于上图的数据分析和数据报表):
上卷(roll-up)
下钻(drill-down)
数据集市,或者叫做"小数据仓库"。如果说数据仓库是建立在企业级的数据模型之上的话。那么数据集市就是企业级数据仓库的一个子集,他主要面向部门级业务,并且只是面向某个特定的主题。数据集市可以在一定程度上缓解访问数据仓库的瓶颈。对于数据集市而言,一般的建模方式是多维数据模型(以星型模型为主),便于OLAP分析。(对应于上图的数据集市)
联机分析处理(OLAP)的概念最早是由关系数据库之父E.F.Codd于1993年提出的。当时,Codd认为联机事务处理(OLTP)已不能满足终端用户对数据库查询分析的需要,SQL对大数据库进行的简单查询也不能满足用户分析的需求。用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。因此Codd提出了多维数据库和多维分析的概念。OLAP分析是建立在多维数据模型基础上的。根据多维数据存储方式的不同又分为ROLAP和MOLAP方式。常用的OLAP服务器有Informix Metacube、Microsoft SQL Server OLAP Services、oracle OLAP Services(ROLAP); Hyperion Essbase(MOLAP
多维数据模型上的OLAP操作(对应于上图的数据分析和数据报表):
上卷(roll-up)
下钻(drill-down)