EDW与维度模型间的抉择
1 EDW(enterprisedatawarehouse,企业级数据仓库),强调从源系统的业务与数据出发,在企业的的全局高度进行业务对象抽象,使其包含整个企业不同源系统的具体业务对象。
1.1 采用雪花模型架构,设计上符合第三范式
1.2 优点:统一规范
1.3 缺点:复杂,开发周期长,成本高昂
2 宽表(维度建模),强调从应用需求的角度出发,以空间换时间,快速响应业务需求,并通过强调维度的一致性来保证各个模型维度数据的一致性
2.1 采用星型模型架构,会出现大量数据冗余
2.2 优点:快速响应
2.3 缺点:当模型数量大了后管理和维度的一致性是巨大的挑战
3 维度建模步骤
3.1 确定主题,如客户关系分析、客流分析等
3.2 确定分析的具体内容(指标),如客户流失率、贡献度等
3.3 以【3.2】为基础设计数据模型
3.4 建立数据集市,分类存储
3.5 新主题重复以上步骤
4 数据仓库分层概览
4.1 缓冲层(buffer),可选
4.1.1 直接从数据源抽取一模一样的一