典型数据仓库建模方法—ER模型
ER模型
数据仓库中提出的建模方法是从全企业的高度设计一个3NF模型,用实体关系(entity relationship ER)模型描述企业业务,在范式理论上符合3NF。
数据仓库中的3NF与OLTP系统中的3NF的区别在于,它是咱在企业角度面向主题的抽象,而不是针对某个具体业务流程的实体对象关系的抽象。
其具有以下几个特点:
1.需要全面了解企业业务和数据。
2.实施周期非常长。
3.对建模人员的能力要求非常高。
采用ER模型建设数据仓库模型的出发点是整合数据,将各个系统中的数据以整个企业角度按主题进行相似性组合和合并,并进行一致性处理,为数据分析决策服务,但是并不能直接用于分析决策。
建模步骤分为三个阶段:
高层建模 :一个高度抽象的模型,描述主要的主题以及主题间的关系,用于描述企业的业务总体概况。
中层模型 :在高层模型的基础上,细化主题的数据项。
物理模型(也叫底层模型) :在中层模型的基础上,考虑物理存储,同时基于性能和平台特点进行物理属性的设计,也可以做一些标的合并、分区的设计等。
ER模型在实践中最典型的代表是Teradata公司基于金融业务发布的FS-LDM(financial services data model),它通过对金融业务的高度抽象和总结,将金融业务划分为10大主题,并以设计面向金融仓库模型的核心为基础,企业基于此模型做适当调整和扩展就能快速落地实施。
FS-LDM 案例:
TeraData金融数据模型