OneData实施工作流流程总结
数据调研
其中又分为业务调研和需求调研。
在业务调研中,首先要理清楚数据仓库覆盖的业务领域都有哪些,覆盖的业务线又有哪些,每一条业务线中有哪些业务模块,每个业务模块有哪些业务流程又是怎么样的。
同时我们要从需求出发,要搞清楚业务或者数据分析那边需要什么,知道他们的需求通常是什么,我们才能建设好我们的数据仓库。书中是这样举例子的:数据分析师想要一个指标:淘宝一级类目商品的成交金额。得到这个需求我们就要分析:根据什么(维度)进行数据汇总,以及汇总什么东西(度量),这里的一级类目就是维度,金额就是度量。我们明确了微观要干什么,然后要从宏观(对于数据仓库)去分析,这里的明细数据层和汇总数据层要怎么设计,数据链路要怎么联通?这是不是一个公用的报表or指标?需不需要公共指标下沉。
架构设计
架构设计是一个从数据域划分到构建总线矩阵的过程。
首先数据域是什么:数据域是指面向业务分析,将业务过程或者维度进行抽象的集合,业务过程可以概括为一个个不可拆分的时间,如下单,支付,退款。数据域划分要做到什么程度才能进行下一步的构建总线的工作呢?我的解释要把数据域和业务过程一一对应,并且做到以下的效果。