维度建模数仓领域中的事实表大致分以下三种:事务事实表,周期快照事实表,累计事实表。
事务事实表与周期快照事实表、累积快照事实表虽然使用相同的一致性维度,但是它们在内容构成以及业务描述上还是有很大的区别。
1.事务事实表
事务事实表记录的事务层面的事实,保存的是最原子的数据,也称“原子事实表”。事务事实表中的数据在事务事件发生后产生,数据的粒度通常是每个事务记录一条记录。一旦事务被提交,事实表数据被插入,数据就不再进行更改,其更新方式为增量更新。由于事实表具有稀疏性质 ,因此只有当天数据才会进入 当天的事实表中,相当于每个分区里面都是每天的数据,不包含之前的数据。
事务事实表的日期维度记录的是事务发生的日期,它记录的事实是事务活动的内容。用户可以通过事务事实表对事务行为进行特别详细的分析。
为什么事务事实表具有稀疏性质?
事实表一般围绕着度量来建立,当度量产生的时候,事实记录就生成了。度量可以是销售数量、交易流水值、月末节余等数值。如果同时生成多个度量值的话,我们可以在一个事实表中建立多个事实。当我们的事实表中的事实比较多时,有可能多个事实不同时发生,如果同时生成的几率很小,我们称之为稀疏事实表(Sparse Facts)。
来自

本文深入探讨了数据仓库中三种核心事实表类型:事务事实表、周期快照事实表及累计快照事实表的特性与应用场景。事务事实表记录最原子的业务事件,周期快照事实表提供定期聚合视图,而累计快照事实表则跟踪业务过程的全生命周期。通过对比三者在粒度、更新方式及数据密度上的差异,帮助读者理解各自的优势与适用场景。
最低0.47元/天 解锁文章
3170

被折叠的 条评论
为什么被折叠?



