我们知道数据仓库的四大特性:
- 面向主题的(Subject Oriented)
- 集成的(Integrate)
- 相对稳定的(Non-Volatile)
- 反映历史变化(Time Variant)
那么,如何理解这四大特性呢?
一.怎么理解数据仓库是面向主题的?
首先理解主题这个概念
抽象意义上:在较高层次上将企业信息系统中数据进行综合、归类分析利用。属于一个抽象概念,每一个主题基本对应一个宏观分析领域。
逻辑意义上:主题(Subject)是对应企业中某一宏观分析领域所涉及的分析对象(重点是分析的对象,对象,仔细理解一下对象的含义)。
例如:"销售分析"就是一个分析领域,这个"销售分析"所涉及到的分析对象为商品、供应商、顾客、仓库等,
那么数仓主题可以确定为商品主题、供应商主题、顾客主题、仓库主题;
联系到下文"销售分析"可以作为一个主题域;如果"产品分析"是一个分析领域,"产品分析"所涉及到的分析对象为商品、地域、时间、类别等,
那么数仓的主题确定为商品主题、地域主题、时间主题、类别主题,"产品分析"可以作为一个主题域。
那面向主题的理解就是,操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织。面向主题的数据组织方式&#