Kimball 维度建模技术(1)
1 事实表技术基础
1.1 事实表结构
发生在现实世界中的操作型事件,其所产生的可度量数值,存储在事实表中。
从最低的粒度级别来看,事实表行对应一个度量事件。
因此事实表的设计完全依赖于物理活动,不受可能产生的最终报表的影响。
1.2 可加、半可加、不可加事实
事实表中的数字度量可划分为三类。
最灵活、最有用的事实是完全可加的,可加性度量可以按照与事实表关联的任意维度汇总。 半可加度量可以对某些维度汇总,但不能对所有维度汇总。 差额是常见的半可加事实,除了时间维度外,它们可以跨所有维度进行假发操作。另外,一些度量是完全不可加的,例如:比率。 对非可加事实,一种好的方式是,尽可能存储非可加度量的完全可加的分量,并计算出最终的非可加事实前,将这些分量汇总到最终的结果集合中。 最终计算通过发生在BI层或OLAP多维数据库层。
1.3 事实表中的空值
事实表中可以存在空值度量。所有聚集函数(sum、count、min、max、avg)均可针对空值实时计算。
然而,在事实表的外键中不能讯在空值,否则会导致违反参照完整性的情况发生。关联的维度表必须用默认行而不是空值外键表示未知的或无法应用的条件。
1.4 一致性事实
如果某些度量出现在不同的事实表中,需要注意,如果需要比较或计算不同事实表中的事实,应保证针对事实的技术定义是相同的。如果不同的事实表定义是一致的,则这些一致性事实应该具有相同的命名,如果它们不兼容,则应该有不的命名用于告诫业务用户和BI应用。
1.5 事务事实表
事务事实表的一行对应空间或时间上某点的度量事件。原子事务粒度事实表是维度化及可表达的事实表,这类

本文介绍了Kimball维度建模技术,包括事实表的基础知识,如事实表结构、可加性分类、空值处理,以及不同类型的事实表,如事务事实表、周期快照事实表、累积快照事实表等,强调了事实的一致性和性能优化的策略。
最低0.47元/天 解锁文章
2060

被折叠的 条评论
为什么被折叠?



