事实表:记录公司的一笔正常的业务数据,需要提供4W,什么时候(When)在什么地方(Where)有哪些人(Who)做了什么事(What)。为了方便后续分析,在设计事实表的时候,我们应该尽可能的提供详细的维度信息和度量信息。
比如我们在谈一家物流公司的数据仓库的时候,如何去设计落地一个事实表,我们按以下过程来落地。
1:用户的目的:首先我们需要知道用户的目的,以价值为导向,解决用户的问题,这时用户会提出,目前公司营运成本太高,今年需要节省多少费用。
2:定义指标:针对上面的目标,我们需要与用户一起来分析这个目标,可以用哪些指标来衡量这个目标往预期方向走,也就是我们所说的拆分目标,这个过程会多次沟通,反复的拆分和合并之前定义的指标,比如说最终我们统一认定有装载率、车辆营运公里数、单公斤成本,单公里成本这4个指标。
3:指标细分:指标确认后,我们就需要细分指标数据(多级指标),比如装载率这个指标,我们是否需要针对业务场景,区分早、中、晚时段的装载情况,不同车型(5KG,10KG)的装载率情况,对于单公斤成本和单公里成本我们是否需要清楚知道成本的费用项,比如司机成本、油费成本、车辆折旧成本等。
4:定义相关字段和逻辑:有了以上细分指标的确定,接下来我们只与用户确认各个指标的逻辑和取数口径了, 设计好事