Inmon企业级数据仓库
关键字:范式建模
数仓:Inmon企业级数据仓库是一个细节数据的集成资源库。数据在物理存储层面满足第三范式设计规范,数据以最低粒度存储。
数据集市:在企业级数仓的基础上,建立部门级数据集市。数据进入数据集市时,进行了一定程度的聚合,方便多维数据分析。
数据应用:上层报表、BI、数据分析应用均取自数据集市的数据。而不是直接查询数据仓库,数据仓库粒度低,直接关联查询效率极低。
关系数据模型,是无冗余、稳定、一致的数据模型,同时为数据集市分析数据提供了更多的灵活性。
Kimball数据仓库
关键字:维度建模
数仓:Kimball数仓和Inmon数仓的建设核心区别在于,Kimball使用的是多维模型设计,即数仓由维度表和事实表以星型或雪花型结构构成。
数据集市:数据集市是一个逻辑概念,数仓按照主题域划分成虚拟数据集市。
数据应用:上层报表、BI、数据分析应用可以直接访问多维数据仓库里的数据。
维度模型是一种趋向于支持最终用户对数据仓库进行查询的设计技术,是围绕性能和易理解性构建的。
混合型数据仓库
关键字:第三范式+维度建模
数仓建设采用第三范式建模,数据集市采用维度建模,好处是:数仓层面采用规范化设计,消除冗余;数据集市层面多维模型可灵活适应上层报表和数据分析等应用。
ODS层的作用
统一存储位置:业务系统来源复杂,将多源数据放到一个统一的地方,方便后续处理。
隔离业务系统:将数仓加工ETL与业务系统隔离,方式ETL操作对应用系统的侵入。
完整映射业务系统:完整映射业务系统,和直接从应用系统进行ETL效果等同。