数据仓库之事实表

一、事实表分类

事实表是指其中保存了大量业务度量数据的表。事实表中的度量值一般称为事实。事实表中最有用的事实就是数字类型的事实和可加类型的事实。事实表的粒度决定了数仓中数据的详细程度。

1. 以粒度划分

(1) 事务事实表(Transaction Grain Fact Table)

一条记录代表了业务系统中的一个事件。事务出现后,就会在事实中出现一条记录。以订单域举例:下单是一个事实;付款是一个事实;退款是一个事实。

(2) 周期快照事实表(Periodic Snapshot Grain Fact Table)

记录指定周期内一些聚集事务值或者度量状态。如:库存日快照事实表

(3) 累积快照事实表(Accumulating Snapshot Grain Fact Table)

用于研究业务过程中各里程碑事件之间的时间间隔,一般会用一个字段记录最后更新时间。如:订单各种状态的开始结束时间。

(4)三种事实表的区别

特点交易事实周期快照事实累积快照事实
用途离散时间点记录事务以规律的间隔产生实施快照时间跨度不确定且不断变化的业务事实
时间/日期时间日期时间跨度较短的多个时点
粒度每行代表一个事务每个代表一个时间周期内的事实每行代表一个业务周期事务事实
事实表加载新增新增新增和修改
事实表更新只插入,不更新只插入,不更新新事件产生时更新,可插入,可更新
时间维业务日期时间末多个业务过程的完成日期
事实交易活动时间周期内的绩效限定多个业务阶段内的绩效

2. 以用途划分

(1)原子事实表(Atom Fact Table)

保存最细粒度数据的事实表

(2)聚集事实表(Aggregated Fact Table)

原子事实表上的汇总,也称汇总事实表。

  • 通过汇总原始数据来提升下游查询的效率
  • 聚集原则:
  • 不跨越数据域:数据域是对数据分类的高层抽象,如订单域、用户域,不同数据域的数据不要聚集在一起
  • 不跨越事实:对于横向钻取,是针对多个事实基于一致的维度进行分析,即融合表,是一种导出模式而不是聚集模式。

(3)合并事实表(Consolidated Fact Table)

位于不同事实表中处于相同粒度的事实进行组合建模而成的一种事实表。即新建立一个事实表,它的维度是两个或多个事实表的相同维度的集合;事实是几个事实表中感兴趣的事实。

参考博文

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值