Kinball在《数据仓库工具箱》一书中,详细阐述维度建模思想,并给出维度建模的众多实践。维度建模的核心内容和建设过程在实践中已经被大家所熟知,网上教程也很多,本文不做赘述。本文重点谈一谈企业数据仓库总线矩阵。
企业数据仓库总线矩阵,又称为“总线矩阵”、“业务矩阵”,是Kinball在《数据仓库工具箱》一书中提出的,指导维度模型建设的规划性文件。
为什么要谈企业数据仓库总线矩阵,一方面是它在数仓建设中非常重要,是纲领性的文件,是数仓最重要的文档交付物(Kinball认为是最重要的交付物之一,我认为可以把“之一”去掉);另一方面,实际工作中发现很少有人提到总线矩阵更谈不上在工作中规划这份文件,更多是直接上手开发后期不停维护的节奏,希望这篇文章能让更多人了解和实践起来。
什么是企业数据仓库总线矩阵
先看示例,一家商品零售商的业务矩阵:
图片来源于《数据仓库工具箱》一书。
总线矩阵包含业务过程、公共一致性维度。每行代表一个业务过程,每列表示一个公共维度,还包括业务过程与维度间的联系,图中每个叉号表示该业务过程与维度具有关联关系,也就是我们通常说的外键。
还可进一步扩展业务矩阵,加入主题划分和业务过程包含的度量值。如下图,某智能制造工厂业务矩阵:
主题 | 维度 业务过程 |
工厂 | 产线 | 项目 | 物料 | 日期 |