数据分层
维度建模
(0) 什么是维度建模?
维度建模以分析决策的需求出发构建模型,构建的数据模型为分析需求(也就是我们通常所说的数据分析)服务。它重点解决如何更快速完成分析需求,同时还有较好的大规模复杂查询的响应性能。
(1) 事实表与事实表
事实表是指保存了大量业务度量数据的表,事实表中的度量一般称为实施。
(2) 维度与维度表
维度表中包含事实表中记录的特性,有些特性提供了描述性信息,有些特性指定如何汇总事实表中的数据,以便未分析者提供有用的信息
(3) 粒度
粒度是指数据仓库的数据单位中,保存数据细化程度的级别
(4) 切片、切块、旋转
- 切片:从多维数组中选定一个二维子集,切出一个“平面” 。比如选中上图的2011年,这就是一个切片。
- 切块:从多维数组中选定一个三维子集,切出一个“立方体” 。比如上图中,年度选择了2011、2012,然后看所有的数据内容,这就是一个切块。
- 旋转:改变一个报告(页面)显示的维方向
(5) 下钻、上卷、钻透
-下钻:从汇总数据深入到细节数据进行观察或增加新维
- 上钻(上卷):从某一维上将低层次的细节数据概括到高层次的汇总数据或减少维数
- 钻透:直接下钻到最明细的数据。
(6) 三种维度建模方法
- 星状模型: 事实表被维度所包围,且维度没有被新的表连接
- 雪花模型:有一个或者多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上的
- 星座模型:多个事实表共享维度表,可视为星状模型的集合