1.什么是数据仓库?
早在上世纪,数据仓库之父 Bill Inmon 在 1991 年出版的 Building the Data Warehouse 一书中首次提出了被广为认可的数据仓库定义。Inmon 将数据仓库描述为一个面向主题的、 集成的、随时间变化的、 非易失的数据集合, 用于支持管理者的决策过程。
1.1 面向主题
数据仓库是面向主题的。 主题是一个抽象概念, 简单地说就是与业务相关的数据的类别, 每一个主题基本对应一个宏观的分析领域。 数据仓库被设计成辅助人们分析数据。
举例:
一个公司要分析销售数据,可建立一个专注于销售的数据仓库,使用这个数据仓库,就可以回答类似于“去年谁是我们这款产品的最佳用户”这样的问题。
这个场景下的销售, 就是一个数据主题, 而这种通过划分主题定义数据仓库的能力,就使得数据仓库是面向主题的。 主题域是对某个主题进行分析后确定的主题的边界,如客户、 销售、 产品都是主题域的例子。
1.2 可集成的
集成的概念与面向主题是密切相关的。