文章目录
简单介绍OLAP和OLTP
- 什么是OLTP?
OLTP:联机事务处理 - 什么是OLAP?
联机分析处理。OLAP是一门对数据仓库中的数据进行分析的技术,方便实现决策支持的目标。由关系数据库之父E.F.Codd
提出
1. 什么是OLAP?
-
OLAP是针对特定问题的联机数据访问和分析处理。使分析人员能迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的
-
OLAP的目标是满足决策支持或多维环境下特定的查询和报表需求,其技术核心是“维”这一概念
-
OLAP与DW
DW:侧重存储和管理面向主题的数据
OLAP:侧重于数据仓库中的数据分析,并将其转换成辅助决策的信息
OLAP特点:多维数据分析。这与数据仓库的多维数据组织管理正好形成相互结合、相互补充的关系。
OLAP技术使数据仓库能够快速响应重复而复杂的分析查询,从而使数据仓库能有效地用于联机分析 -
OLAP与OLTP
OLTP:关系型数据库的主要应用。包括增删改查,主要面向日常的事务处理
OLAP:数据仓库的主要应用。侧重决策支持,支持分析操作,并提供直观易懂的查询结果
2. OLAP的分析方法
基本概念
- 维:观察问题的特定角度。例:时间维、地区维
- 维的层次:维的细节程度。例:时间维可分为日期、月份、季度、年
- 维的成员:维的一个取值。例:2021年4月18日
- 多维数组:维和变量的组合。一个多维数组可以表示为(维1,维2,…,维n,变量)。(时间,地区,产品,销售额)
- 数据单元(单元格):多维数组的取值。(2000年1月,上海,笔记本电脑,¥10000)
2.1 切片Slice
广义:在多维数组的某一维上选定一个维成员,即从n维数组选取n-1维子集.(降一维)
狭义:从多维数组选定一个二维子集,切出一个“平面”(降n-2维)
2.2 切块Dice
广义:在多维数组的某一维上选定某一区间的维成员,即限制某一维的取值区间(没有降维)
狭义:从多维数组选定一个三维子集,切出一个“立方体”(降n-3维)
切片是切块的特例,即限制的取值区间只取一个维成员
切块可看作由多个邻接的切片迭合而成
2.3 旋转Rotate
改变一个报告(或页面)显示的维方向
2.4 钻取Drill
根据维层次,改变数据的粒度
钻取包括向下钻取(Drill-down)和向上钻取(Drill-up)/上卷(Roll-up)。钻取的深度与维所划分的层次相对应
下钻:从汇总数据深入到细节数据进行观察或增加新维。
上钻:在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数
3. OLAP的数据组织
3.1 ROLAP(Relational OLAP )
基于关系数据库的OLAP
有良好的可扩展性/伸缩性,利于增加维
3.2 MOLAP(Multidimensional OLAP)
基于多维数据库的OLAP,采用类似于多维数组的结构
优点:能进行快速索引,响应速度快
3.3 HOLAP(Hybrid OLAP)
对最常用的维,使用多维数据库存储;
对于不常用的维度,采用ROLAP存储;
充分利用ROLAP的可伸缩性和MOLAP的快速计算