1.1 数据仓库之父比尔(Bill Inmon)在1991年出版的“Building the Data Warehouse”(《建立数据仓库》)一书中所提出的定义被广泛接受:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。比尔在著作《Building the Data Warehouse》中提出数据仓库的特征:
1)集成的 (Integrated):
数据仓库将来自不同源系统的数据集成到一个统一的存储中,消除了数据的分散性。
2)面向主题的 (Subject-Oriented):
数据仓库是以主题或业务需求为导向的,而不是以特定的应用程序或业务过程为导向。
3)相对稳定的
数据仓库中的数据是持久的,不会随着时间的推移而丢失。
4)反映历史变化
数据仓库包含了历史数据,可以追溯和分析过去的变化。
数据仓库里的数据作为分析用的数据源,提供给后面的即席查询、 分析系统、数据集市、报表系统、数据挖掘系统等。
1.2 Kimball的定义(由Ralph Kimball提出,也是数据仓库领域的重要贡献者):
数据仓库是“可查询、可扩展、集成的、主题导向的、历史的数据存储,用于支持管理决策”。
a.可查询的:数据仓库中的数据易于查询和分析,以满足各种业务需求。
b.可扩展的:数据仓库可以根据业务需求进行扩展,添加新的数据源和主题。
c.历史的:与Inmon的定义类似,数据仓库包含历史数据,支持时间趋势分析。
这两个定义反映了数据仓库的核心特征,包括 数据集成 、主题导向、非易失性、时间变化、可查询性以及支持管理决策。数据仓库通常用于帮助组织更好地理解其数据,支持决策制定、报告和分析等活动。