数据仓库建模与分层
一. 基本理解
定义: 面向主题的,集成的,相对稳定的,反映历史变化的 数据集合,用于支持管理决策。
-
什么是主题
实体 + 事件
-
怎样划分主题
实体:业务关系的对象 ,可以是一个 人 或者 物, 比如:用户 , 订单
事件:业务过程, 比如: 报名,注册 ,购买,退费
-
如何相对稳定
数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,修改和删除操作很少,通常只需要定期的加载、刷新。
二. 数据仓库建模
Inmon理论:自上而下。先以范式建模构建企业数据长仓库,再以维度建模设计数据集市。
特点:1. 一份数据,没有数据冗余,保证数据一致性;
2. 解耦(系统级不业务级),方便维护;
3.开収周期较长,开収成本较高;
Kimball理论:自下而上。提倡维度建模,以星形模型戒是雪花模型等方式构建维度数据仓库、数据集市。
特点:1. 模型结构简单,星型模型为主;
2. 开収周期短,能够快速迭代;
3. 维护成本较高;