0.引言
如果你是数据仓库工程师/BI工程师/ETL工程师,在面试时你肯定会听到的问题有“你的项目采用的数仓分层是什么?”/“每一层的作用是什么?”/“每一层如何构建的,使用了什么工具?”
面试官问的这些问题,恰恰对应了描述我们要关注数仓分层的三个要点——架构、功能、构建。
1.分层简析
大家如果对概论也就是第0章有印象,就会还记得这张图。
这张图描述的是一个公司数仓的整体架构,每个DM(数据集市)代表一个业务(面向特定的分析决策需求场景,也叫主题)。在这里我们针对每个DM以更细粒度的视角单独讨论,看看DM内部长什么样。
这张图就是每个DM内部的样子,我没有像其他博主在这里加一些箭头来描述ETL的flow,这一部分是构建关心的内容。
细心的朋友会发现:整体架构中,ODS独立于DM之