ER模型
是从全企业的高度设计一个3NF模型,用实体关系(Entity Relationship,ER)模型描述企业业务。其具有以下几个特点:
需要全面了解企业业务和数据、实施周期非常长、对建模型人员要求非常高
采用ER模型建设数据仓库的出发点是基于整合数据,将各个系统的数据以企业角度按主题进行组合和合并,并进行一致性处理,为数据分析决策服务,但是并不能直接用于分析决策。其建模步骤分为三个阶段:
高层模型:一个高度抽象的模型,描述主题与主题之间的关系,用于描述企业的业务总体概况。
中层模型:在高层模型的基础上,细化主题的数据项。
物理模型:在中层模型的基础上,考虑物理存储,同时基于性能和平台特点进行物理属性的设计,也可能做一些表的合并、分区表的设计等。
维度模型
维度模型是数据仓库的Ralph Kimball大师所倡导的,也是数据仓库工程领域最流行模型。维度建模是从分析决策的需求出发构建模型,为分析需求服务,因此它重点关注用户如何更快速地完成分析,同时具有较好的大规模复杂查询的响应性能。其典型的代表是星形模型和雪花模型。
Data Vault模型
Data Vault是Dan Linstedt发起创建的一种模型,它是ER模型的衍生。它强调建立一个可审计的基础数据层,也就是强调数据的历史性、可追溯性和原子性,而不要求对数据进行过度的一致性处理和整合;同时他基于主题概念将企业数据进行结构化组织,并引入了更进一步的发生处理来优化模型,以应对预案系统变更的扩展性。
Anchor模型
Anchor模型是对Data Vault模型做了进一步规范化处理,其核心思想是所有扩展只是添加而不是修改,因此将模型规范到6NF。但是这样大大增加了查询join操作,不太适合有比较多的join操作的数据仓库。