1. Introduction
宽泛的讲,数据仓库是一种数据库,它与单位的操作数据库分别维护。数据仓库系统允许将各种应用系统集成在一起,为统一的历史数据分析提供坚实的平台,对信息处理提供支持。
Data warehousing is acollection of decision support technologies, aimed at enabling the knowledgeworker(executive, manager, analyst) to make better and faster decisions.
A data warehouse is a “subject-oriented,integrated, time-varying, non-volatile collection of data that is usedprimarily in organizational decision making”(William H. Inmon, 1996)
注意区分data warehouse(数据仓库)和 datawarehousing(构建和使用数据仓库的过程)。
四个关键字,面向主题的,集成的,时变的,非易失的,将数据仓库与其他数据存储系统相区别。
面向主题:数据仓库关注决策者的数据建模与分析;集成的:构造数据仓库是将多个异构数据源继承在一起;时变的:数据存储从历史的角度(如过去的5到10年)提供信息;非易失的:数据仓库总是物理的分离存放数据(它只需要两种数据访问操作:数据的初始化装入和数据访问)
数据仓库支持联机分析处理(on-line analytical processing),这有别于操作数据库所支持的联机事务处理(on-line transaction processing)。