Data Warehouse 系列之构建业务总线矩阵

一、什么是数仓总线矩阵?

数据仓库总线矩阵(Data Warehouse Bus Matrix)是数据仓库设计中一个重要工具。
它用于定义数据仓库中的业务过程和数据维度之间的关系,提供了数据模型的整体视图以及
数据仓库中各个数据源之间的关系。总线矩阵通常是一个表格,其中每一行代表一个业务过
程,每一列代表公共维度(一致性维度),还包括业务过程与维度间的联系,图中每个叉号
表示该业务过程与维度具有关联关系,也就是我们通常说的外键。
数据仓库总线矩阵通常由两个维度构成:业务过程和数据维度。业务过程包括数据分析
需求中所涉及的各个业务过程,例如销售,采购,库存等。数据维度则包括数据仓库中所储
存的数据维度,如时间,地点,产品等。矩阵中的每一个交叉点表是一个业务过程与一个数
据维度之间的关系。

二、构建业务总线矩阵的优势

https://mp.weixin.qq.com/s?__biz=MzkyNzUzNjI5Ng==&mid=2247483720&idx=1&sn=1981540872a2d76de08eda61910ce013&chksm=c227c48ff… 2/3

通过构建数仓业务总线矩阵,可以让设计者清晰的了解每个业务过程对应的数据维度,
从而更好的把握数仓中的数据模型设计。
业务驱动:数据仓库总线矩阵将业务过程和数据维度进行关联,使得数据仓库设计更加贴
合业务需求。
可维护性:通过数据仓库总线矩阵,我们能够容易的了解数据仓库中的数据模型结构,从
而更好的进行拓展和维护。
数据一致性:通过数据仓库总线矩阵,我们可以清晰的发现业务过程之间的交叉点,从而
找出数据模型中重复或冗余部分,保证数据一致性。

三、如何设计总线矩阵?

1、主题域划分,业务过程的确立

主题域或者数据域的划分没有对错,根据实际的情况进行划分,让数据更清晰,更好
找,更易用就是好的数据域划分。可参考以下规则:数量不要太多,不同主题之间无业务重
叠,涵盖目前所有业务并且还要有一定的前瞻性易扩展。
然后就是业务过程的确立,按照某个规则将相关业务划分到同一个主题域,常用规则
有:按业务相关性,按需求方,按应用划分等。

2、确定公共一致性维度以及度量

一致性维度:在同一主题域中,两个维度如果有关系,要么就是完全一样的,要么就是
一个维度在数学意义上是另一个维度的子集。
维度是我们看世界的角度,度量则是形容指标的水平,他们都是指标的重要组成。
最后是确定业务过程同维度间的关联关系。应该分析每个业务过程,尽可能多的关联维度
与业务过程,而不仅仅是当前分析需要哪些维度,否则就陷入了面向需求开发的陷阱。

总结:

构建业务总线矩阵是数据仓库建设中重要的一个点,可以让我们清晰的了解数仓模
型的结构,方便维护和扩展,希望大家要重视起来,从而提高组织的数据驱动决策能
力。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值