-
事实表:事实表用于存储业务过程中的事实或度量,这些度量通常是可度量、可加总的业务数据。如销售额、数量、利润等。
-
维度表:维度表用于存储业务过程中用于描述度量的上下文信息的维度。维度提供了对度量的分类、分组和过滤的途径。维度表包含描述性的、非数值的属性。
-
事实表和维度表关系:以销售事实表为例,可能包含销售额、销售数量、利润等度量列,外键列可能关联到产品维度、时间维度和地理维度。
-
关系模型:星型、雪花、星座
-
宽表:业务主题相关的指标与维度、属性关联在一起的表。
-
粒度:数据单位中保存数据的细化或综合程度的级别。
-
维度退化:将一些常用的维度属性直接写入到事实表中的维度操作。
-
维度层次:维度中的一些描述属性以及层次方式或一对多的方式相关联。
-
下钻:数据明细从粗粒度到细粒度的过程。
-
上卷:数据的汇总聚合,即从细粒度到粗粒度的过程。
-
规范化:按三范式,使用事实表和维度表的方式管理数据。
-
反规范化:将维度的属性合并到单个维度中的操作。
-
业务过程:组织完成的操作型活动,如获取订单、付款。
-
原子指标:基于某一业务的度量,业务过程+度量值+聚合逻辑。
-
派生指标:原子指标+日期限定+业务限定+粒度限定。
-
衍生指标:一个或多个派生指标的基础上,通过各种逻辑运算合成的。
-
数据域:联系较为紧密的数据主题的集合。
-
业务总线矩阵:用于设计企业数据仓库总线架构的基本工具。
数仓建模相关概念
最新推荐文章于 2024-09-28 18:24:28 发布