Data Warehouse 系列之数仓主题域

数据仓库具有面向主题的特性,那么便会有主题的概念。数仓建设是遵循纵向分层开发,横向划分主题域设计,数仓的分层上文我们已经讲述,今天来聊聊数仓主题域划分,同时会引申出主题的划分、数据域是什么,以及业务过程。

一、什么是主题域?

数仓主题域:通常是联系较为紧密的数据主题的集合,根据业务需求分析的视角进行抽象归类。也就是把臭味相投的划分到一起或者感觉到了就该在一起图片图片。
划分方法:主题域划分的方法一般有几种方式:
Ⅰ、要么按照业务过程来划分,一个业务过程抽象出一个主题域,比如业务系统中的商品,交易,物流等。
在这里插入图片描述
Ⅱ、要么按照业务部门来划分,一个业务部门抽象出一个主题域,比如中台,采购,销售部门等。
图片
Ⅲ、要么按照业务系统来划分,一个业务系统抽象出一个主题域,比如订单中心系统,ERP系统,SAP系统等

二、什么是主题划分?

数仓主题:是在较高层次上将企业生产上的各个系统中某一分析对象的数据进行整合,归类并分析的一种范围,属于一种抽象概念,简单来说就是每一个主题对应一个宏观分析领域。
划分方法:主要是要识别分析对象主体,做主题划分和主题域划分,个人建议要站在全局的角度来看待,然后先划分出主题域,再接着在主题域里面划分出各个主题,主题域的划分一般比较谨慎,一旦定下来避免频繁的变动,虽然数仓建设是迭代建设的,不能保证一次性初始化好,但我们的主题域划分和主题划分要尽可能涵盖企业所有业务,以及适应新的业务场景。

三、案例分享

以xx供应链订单交易模型的建设为例,基于业务生产总线的设计是常见的模式,首先调研订单交易的完整过程,定位过程中的关键节点,确认各节点上发生的核心事实信息。
在这里插入图片描述

四、主题域,数据域,业务过程

在这里插入图片描述

主题域:面向业务过程,将业务活动事件进行抽象的集合,如下单,支付,退款都是业务过程,针对公共面向层(DWD)进行主题划分。
数据域:面向业务分析,将业务过程或者维度进行抽象的集合,针对公共汇总层(DWS)进行数据域划分。

业务过程:指企业的业务活动事件,如下单,支付,退款都是业务过程,业务过程是一个不可拆分的行为事件。

其实数据域和主题域的差别不大,很大情况下两者就等同于一个概念。

五、总结

数据仓库建设是一套方法论,但并不是一个“定理”,我们需要学习这些方法论,然后结合自己公司实际的业务场景来实现,只要能有序的把数据管控起来,同时又能高效的帮助数据分析,实现业务价值就好了,不必一味的追求“行业标准”。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值