数据仓库是一种信息系统,它能给一个组织或机构提供商务智能(business intelligence)以支持管理决策的制定。
W.H.Inmon在《Building the Data Warehouse》一书中对数据仓库定义如下:
数据仓库是
面向主题的
集成的
稳定的
随时间增量的
数据集合,用以支持管理决策
这个定义说明了数据仓库中数据的组织方式以及建立数据仓库的目的是什么。
**
数据仓库是面向主题的。
**
典型的主题域:客户;产品;交易;帐目
主题域以一组相关表来具体实现
一个主题域的表来源于多个操作型应用(如:客户主题,来源于:定单处理;应收帐目;应付帐目;…)
相关表通过公共的键码联系起来(如:顾客标识符Customer ID)
每个键码都有时间元素(每月累积;日期…)
主题内数据可以存储在不同介质上(综合级,细节级,多粒度)
**数据仓库是集成的。
**
多个异构数据源
关系数据库,无结构文件,联机事务处理记录
数据清理和数据整合技术
不同的应用在编码、命名、属性的度量等方面都有很大的差别,数据集成就是要解决这些问题