数仓数据建模中的概念总结(数据域、主题域、总线矩阵、指标...)

本文介绍了业务分类、数据域划分的重要性,强调了业务过程与维度的关系,以及如何通过总线矩阵理解数据结构。维度和其属性、时间周期、修饰词的概念也被详细阐述,包括原子指标和派生指标的定义和使用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

概念归纳

  • 业务分类:业务板块是某一大类业务的指标和维度的集合,如电商,文 娱。

  • 数据域:面向业务分析,将业务过程或者维度进行抽象的集合,如交易域, 日志域。
    将零散的需求分类,后续一一展开,这个过程叫数据域划分。数据域需要抽象提炼、并且长期维护和更新的,但不轻易变动。在划分数据域时, 既能涵盖当前所有的业务需求,又能在新业务进入时无影响地被包含进已有的数据 域或者扩展新的数据域。 在这里插入图片描述
    事实表为了更好地进行分析,往往会冗余一些维度属性,例如交易域的“购买商品”业务过程,会冗余店铺、商品、会员等维度信息,因此,我们还需要分析业务过程与维度的关联关系,这个时候,就要用到总线矩阵了。

  • 总线矩阵:是一种在全局视角理解数据结构的一种工具,可以让相关人员对整个数 仓结构能够有清晰了解,很容易就能看出来数据域与业务过程、维度的关系;以及 业务过程与维度的关系。在这里插入图片描述

  • 业务过程:业务过程指企业的业务活动事件,如下单,支付。

  • 数据集市:面向某个应用场景或者产品的数据组织,一般会

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值