文章目录
数据模型篇 《二》阿里巴巴数据整合及管理体系
面对爆炸式增长的数据,阿里巴巴内部使用OneData方法体系对数据进行有序和有结构地分类组织和存储,避免重复建设和数据不一致性,保证数据的规范性。
概述
定位及价值
建设统一的、规范化的数据接入层(ODS)和数据中间层(DWD 和DWS),通过数据服务和数据产品,完成服务于阿里巴巴的大数据系统建设,即数据公共层建设。降低数据互通成本,释放计算、存储、人力等资源。
体系架构
业务板块:根据业务的属性划分出几个相对独立的业务板块。
规范定义:结合行业的数据仓库建设经验,设计出的一套数据规范命名体系。
模型设计:以维度建模理论为基础,构建一致性的维度和事实(进行规范定义)。
规范定义
名词术语
名词术语 | 解释 |
---|---|
数据域 | 指面向业务分析,将业务过程或者维度进行抽象的集合。其中,业务过程可以概括为一个个不可拆分的行为事件,在业务过程之下,可以定义指标;维度是指度量的环境,如买家下单事件,买家是维度。为保障整个体系的生命力,数据域是需要抽象提炼,并且长 |