数据仓库-Data Vault模型
Data Vault模型简介
一种数据仓库建模方法,用于存储来自多个操作型系统的完整的历史数据。每个数据行都包含数据来源和装载时间属性,用以审计和跟踪数据值所对应的源系统。
Data Vault(DV)模型用于企业级的数据仓库建模,是Dan Linstedt在20世纪90年代提出的。在最近几年,获得很多关注。
定义如下
面向细节的,可追溯历史的,一组有连接关系的规范化的表的集合。
他是综合了第三范式和星型模型优点的建模方法。
其设计理念是满足企业对灵活性、可扩展性、一致性和对需求的适应性的要求,是一种专为企业级数据仓库量身定制的建模方式。
Data Vault模型的组成部分
data Vault模型有中心表(Hub)、链接表(Link)、附属表(Satellite)三个主要组成部分。
中心表记录业务主键,链接表记录业务关系,附属表记录业务描述。
中心表
保存一个组织内每个实体的业务主键。
中心表和源系统表是互相独立的。
中心表属性
主键
业务主键
装载时间
数据来源
链接表
是中心表之间的链接。
一个链接表意味着两个或多个中心表之间有关联。
链接表属性
主键
外键
装载时间
数据来源
附属表
用来保存中心表和链接表的属性
包含所有的历史变化数据
一个附属表总有且唯一一个外键