一篇文章搞懂数据仓库:三种事实表(设计原则,设计方法、对比)(1)

本文深入解析数据仓库中的累积快照事实表,对比不同事实表类型,并阐述设计事实表的8大原则,包括粒度选择、事实一致性、处理NULL值等,旨在帮助读者掌握数据仓库设计的核心概念。
摘要由CSDN通过智能技术生成

以一个周期为时间间隔,来记录事实,一般周期可以是每天、每周、每月、每年等;

个人理解:只看某个业务过程,比如订单收货,数据按订单收货时间来切分,周期可以为每天、每月等。

  • 1.3 累积快照事实

用来描述过程开始和结束之间的关键步骤事件,覆盖过程的整个生命周期,通常具有多个日期字段来记录关键时间点;当过程随着生命周期不断变化时,记录也会随着过程的变化而被修改;

个人理解:要看整个生命周期的多个业务过程,比如:创建订单 → 买家付款 → 卖家发货 → 买家确认收货。粒度是一个订单一行数据,创建订单时间,付款时间,发货时间,收货时间,分别作为一个字段,便于计算不同业务过程的时间间隔。

2、三种事实表对比

=========

  事务事实表  周期快照事实表  累积快照事实表 
时期/时间  离散事务时间点  以有规律的、可预测的  用于时间跨度不确定的不断变化的工作流 
日期维度  事务日期  快照日期  相关业务过程涉及的多个日期 
粒度 每行代表实体的一个事务  每行代表某时间周期的一个实体  每行代表一个实体的生命周期 
事实  事务事实 累积事实 相关业务过程事实和
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值