背景
通过最近的学习与工作总结,针对不同层级的数仓建模特点,记录数仓建模实战中的一些思路与步骤。涉及到的数仓分层有:ODS层、DWD层、DWS层/DWT层、ADS层,其中ODS层属于业务数据库贴源层,存放的数据与业务系统源表保持一致,所以此处不做讲解。
DWD层建模思路与步骤
dwd层是以业务过程为驱动进行建模,dwd层需要构建维度模型,采用星型模型构建,呈现的形态为星座模型。
dwd层建模步骤
选择业务过程->声明粒度->确认维度->确认事实
选择业务过程
- 如何选择业务过程?
梳理业务系统的业务流程,整个业务流程中产生用户行为的操作可以记为一个业务过程
- 需要遵循的原则?
挑选感兴趣的业务线,如下单业务、支付业务、退单业务,每个业务线对应一张事实表。
中小型公司:一般涉及的业务表在50张以下,这时候尽可能选择所有业务线。
大公司:一般涉及的业务表比较多,有的大公司涉及的业务表多达1000张左右,这时候需要根据业务需求选择对应的业务线。
- 实例
<