9.4,模型实施
9.4.1,业界常用的模型
Kimball和Inmon模型
9.4.2,OneData 实施过程
指导方针
数仓建设时,需要充分进行业务调研(自下而上) 和 需求分析(自上而下)。使用 OneData 工具完成指标规范定义和模型设计。
实施工作流
(1)数据调研
- 业务调研
业务领域:在阿里如电商、数字娱乐、导航、移动互联网等
业务领域包含业务线:如电商领域涵盖ToC(淘宝、天猫、天猫国际)和ToB(阿里巴巴中文站、国际站)
阿里一般对业务领域各自建立数据仓库
- 需求调研
两个重点:分析方向(同运营、分析师交流),分析报表
(2)架构设计 - 数据域分析
数据域是指面向业务分析,将业务过程或者维度进行抽象的集合。
业务过程可以概括为一个个不可拆分的行为事件,如下单、支付、退款。为保障整个体系的生命力,数据域需要抽象提炼,并且长期维护和更新,但不轻易变动。在划分数据域时,既能涵盖当前所有的业务需求,又能在新业务进入时无影响地被包含进已有的数据域中或者扩展新的数据域。 - 构建总线矩阵
(3)规范定义
规范定义主要定义指标体系,包括原子指标、修饰词、时间周期和派生指标。
(4)模型设计
模型设计主要包括维度及属性的规范定义,维表、明细事实表和汇总事实表的模型设计。
(5 )总结
OneData 的实施过程是一个高度迭代和动态的过程, 一般采用螺旋式实施方法
我是dyson不只是吹风机,若是对大数据-数据仓库技术感兴趣的可以加我沟通交流,一起进步。VX:daijun1211
ps:若文章侵权、触犯隐私请联系作者删除,谢谢~~