大数据之路精读:OneData实施工作流流程总结

OneData实施工作流流程总结

数据调研

其中又分为业务调研和需求调研。
在业务调研中,首先要理清楚数据仓库覆盖的业务领域都有哪些,覆盖的业务线又有哪些,每一条业务线中有哪些业务模块,每个业务模块有哪些业务流程又是怎么样的。
同时我们要从需求出发,要搞清楚业务或者数据分析那边需要什么,知道他们的需求通常是什么,我们才能建设好我们的数据仓库。书中是这样举例子的:数据分析师想要一个指标:淘宝一级类目商品的成交金额。得到这个需求我们就要分析:根据什么(维度)进行数据汇总,以及汇总什么东西(度量),这里的一级类目就是维度,金额就是度量。我们明确了微观要干什么,然后要从宏观(对于数据仓库)去分析,这里的明细数据层和汇总数据层要怎么设计,数据链路要怎么联通?这是不是一个公用的报表or指标?需不需要公共指标下沉。

架构设计

架构设计是一个从数据域划分到构建总线矩阵的过程。
首先数据域是什么:数据域是指面向业务分析,将业务过程或者维度进行抽象的集合,业务过程可以概括为一个个不可拆分的时间,如下单,支付,退款。数据域划分要做到什么程度才能进行下一步的构建总线的工作呢?我的解释要把数据域和业务过程一一对应,并且做到以下的效果。image.png
那怎么才能做到这样的效果呢?我认为先得把前面数据调研得到的业务线各模块进行总结归纳,然后名且这些模块里面都有哪些业务动作,注意是业务动作
image.png
得到表9.5的图标,我们已经初步做到划分数据域的效果,下一步动作可以转向构建总线矩阵。
我们已经有了数据域划分后与各业务过程的关系,这样的话构建总线矩阵就好做了。总线矩阵归根到底就是要看到数据域与维度的关系。我们有了表9.5我们就得到了具体的数据域,同时得知有哪些业务过程,也就是知道了有哪些维度也其相关,然后我们总结提炼出来就完事了。这里拿采购分销数据域作为例子,通过商品采购业务过程分析提炼出一致性维度。image.png

规范定义

规范定义主要定义指标体系,包括原子指标、修饰词、时间周期和派生指标等。

模型设计

站在宏观的角度,通过ETL手段设计维度表、明细事实表、汇总事实表。

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值