事实表分为三类:事务事实表,周期快照事实表,累计事实表

3 篇文章 0 订阅
1 篇文章 0 订阅

维度建模中,事实表分为三类:事务事实表,周期快照事实表,累计事实表,他们维度一致,但功能要求和描述的业务事实存在巨大差异。

1. 事务事实表

事务事实表记录事务层面的事实,保存最为原子的数据,其数据在事务发生后发生,粒度为每一行数据。其一旦提交不能修改,增量更新。

事实表一般围绕着度量来建立,当度量产生的时候,事实记录就生成了。度量可以是销售数量、交易流水值、月末节余等数值。一般会根据数据度量以及提前规定好的一致性维度来进行统计等工作。

事务的数字度量分为三种:

1)可加事实

可加事实指的是该度量可以按照和事实表关联的任一维度进行汇总。比如商品的单价,可以按照品类维度进行汇总,按照店铺维度进行汇总等等。

2)半可加事实

指的就是该度量在某些维度下不可进行汇总,或者说汇总起来没有意义,比如说价差额,价差额在时间维度下的汇总就没有意义。

3)不可加事实

指的是该度量在所有与该事实表关联的维度下都不可进行汇总,比如说比率型数据

2.周期快照事实表

周期快照表以具有规律性、可预见时间的记录事实,它统计的是间隔周期内的度量统计,如历史至今、自然年至今、季度至今等等,其更新方式同事务事实表,采用增量更新。

周期快照事实表粒度是每个时间段一条记录,通常比事务事实表的粒度要粗,是在事务事实表之上建立的聚集表,维度比事务事实表要小,但记录的事实比事务事实表更多,事务事实表是稀疏表,周期快照表是稠密表。

1)什么是稀疏表,什么是稠密表?

  稀疏表:当天只有发生了操作才会有记录

  稠密表:当天没有操作也会有记录,便于下游使用

事务事实表是 稀疏的,只有当天发生的业务过程,事实表才会记录该业务过程的事 实, 如下单、支付等;而快照事实表是稠密的,无论当天是否有业务过程发 生,都会记录一行,比如针对卖家的历史至今的下单和支付金额,无论 当天卖家是否有下单支付事实,都会给该卖家记录一行

就比如用户周一下单3单,周二没有下单,但系统仍在周二分区里记录该周下单3单。

3.累计快照事实表

积累快照事实表与周期快照事实表比较相似,都是存储事务数据的快照相信,但后者积累确定周期的数据,而积累积累不确定周期的数据,其可能覆盖一个完整的事务或产品的生命周期,通常有多个日期字段,记录生命周期的关键时间点,比如订单记录快照事实表有付款日期,发货日期和收货日期时间点。

周期快照事实表记录重复的可预测到的时间间隔事实,例如账号月余结事实表,而记录快照事实表适合较短周期,有明确开始时间和结束状态时间,中间记录每个步骤的执行时间,使得分析人员对整体过程有所把握。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值