目前业界较为流行的数据仓库的建模方法非常多,这里主要介绍范式建模法,维度建模法,实体建模法、Data Vault模型、Anchor模型等几种方法
1、3NF范式建模方法
参见 https://blog.csdn.net/yaoyelinger0912/article/details/95500762
2、维度建模法
参见 https://blog.csdn.net/yaoyelinger0912/article/details/95516986
3、实体建模法(实体关系图)
参见https://blog.csdn.net/yaoyelinger0912/article/details/95517168
4、Data Vault模型
Dan Linstedt提出,ER模型衍生,为实现数据整合,不能直接用于分析决策
DataVault是在ER模型的基础上衍生而来,模型设计的初衷是有效的组织基础数据层,使之易扩展、灵活的应对业务的变化,同时强调历史性、可追溯性和原子性,不要求对数据进行过度的一致性处理;并非针对分析场景所设计
组成部分:hub(企业核心业务实体),Link(hub间的关系,与ER模型最大区别是将关系做为一个独立单元抽象,可提升扩展性),Satellite(hub的描述内容)
5、Anchor模型
Lars Ronnback提出,高度可扩展模型,扩展只添加不修改。6NF,基本变成k-v结构化模型。增加非常多的join操作,主要适用于基于一小部分字段进行分析的查询,类似列式存储
组成部分:Anchors(类似hub,业务实体,只有主键),Attributes(类似Satellite,一个表只有一个Anchors属性,k-v结构),Knots(可能会被Anchors使用的多个公共属性)
在各组成部分基础上,又细分历史和非历史。历史会以时间戳加多条记录方式,记录数据变迁历史