数仓建模理论--ER模型、Data Vault模型、Anchor模型、维度建模各自应用场景

ER模型
是从全企业的高度设计一个3NF模型,用实体关系(Entity Relationship,ER)模型描述企业业务。其具有以下几个特点:
需要全面了解企业业务和数据、实施周期非常长、对建模型人员要求非常高
采用ER模型建设数据仓库的出发点是基于整合数据,将各个系统的数据以企业角度按主题进行组合和合并,并进行一致性处理,为数据分析决策服务,但是并不能直接用于分析决策。其建模步骤分为三个阶段:
高层模型:一个高度抽象的模型,描述主题与主题之间的关系,用于描述企业的业务总体概况。
中层模型:在高层模型的基础上,细化主题的数据项。
物理模型:在中层模型的基础上,考虑物理存储,同时基于性能和平台特点进行物理属性的设计,也可能做一些表的合并、分区表的设计等。

维度模型
维度模型是数据仓库的Ralph Kimball大师所倡导的,也是数据仓库工程领域最流行模型。维度建模是从分析决策的需求出发构建模型,为分析需求服务,因此它重点关注用户如何更快速地完成分析,同时具有较好的大规模复杂查询的响应性能。其典型的代表是星形模型和雪花模型。

Data Vault模型
Data Vault是Dan Linstedt发起创建的一种模型,它是ER模型的衍生。它强调建立一个可审计的基础数据层,也就是强调数据的历史性、可追溯性和原子性,而不要求对数据进行过度的一致性处理和整合;同时他基于主题概念将企业数据进行结构化组织,并引入了更进一步的发生处理来优化模型,以应对预案系统变更的扩展性。

Anchor模型
Anchor模型是对Data Vault模型做了进一步规范化处理,其核心思想是所有扩展只是添加而不是修改,因此将模型规范到6NF。但是这样大大增加了查询join操作,不太适合有比较多的join操作的数据仓库。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值