【大数据开发基础】第三章OLAP

简单介绍OLAP和OLTP

  1. 什么是OLTP?
    OLTP:联机事务处理
  2. 什么是OLAP?
    联机分析处理。OLAP是一门对数据仓库中的数据进行分析的技术,方便实现决策支持的目标。由关系数据库之父E.F.Codd提出

1. 什么是OLAP?

  1. OLAP是针对特定问题的联机数据访问和分析处理。使分析人员能迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的

  2. OLAP的目标是满足决策支持或多维环境下特定的查询和报表需求,其技术核心是“维”这一概念

  3. OLAP与DW
    DW:侧重存储和管理面向主题的数据
    OLAP:侧重于数据仓库中的数据分析,并将其转换成辅助决策的信息
    OLAP特点:多维数据分析。这与数据仓库的多维数据组织管理正好形成相互结合、相互补充的关系。
    OLAP技术使数据仓库能够快速响应重复而复杂的分析查询,从而使数据仓库能有效地用于联机分析

  4. OLAP与OLTP
    OLTP:关系型数据库的主要应用。包括增删改查,主要面向日常的事务处理
    OLAP:数据仓库的主要应用。侧重决策支持,支持分析操作,并提供直观易懂的查询结果
    在这里插入图片描述

2. OLAP的分析方法

基本概念

  1. 维:观察问题的特定角度。例:时间维、地区维
  2. 维的层次:维的细节程度。例:时间维可分为日期、月份、季度、年
  3. 维的成员:维的一个取值。例:2021年4月18日
  4. 多维数组:维和变量的组合。一个多维数组可以表示为(维1,维2,…,维n,变量)。(时间,地区,产品,销售额)
  5. 数据单元(单元格):多维数组的取值。(2000年1月,上海,笔记本电脑,¥10000)

2.1 切片Slice

广义:在多维数组的某一维上选定一个维成员,即从n维数组选取n-1维子集.(降一维)
狭义:从多维数组选定一个二维子集,切出一个“平面”(降n-2维)

2.2 切块Dice

广义:在多维数组的某一维上选定某一区间的维成员,即限制某一维的取值区间(没有降维)
狭义:从多维数组选定一个三维子集,切出一个“立方体”(降n-3维)

切片是切块的特例,即限制的取值区间只取一个维成员

切块可看作由多个邻接的切片迭合而成

2.3 旋转Rotate

改变一个报告(或页面)显示的维方向

2.4 钻取Drill

根据维层次,改变数据的粒度
钻取包括向下钻取(Drill-down)和向上钻取(Drill-up)/上卷(Roll-up)。钻取的深度与维所划分的层次相对应
下钻:从汇总数据深入到细节数据进行观察或增加新维。
上钻:在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数

3. OLAP的数据组织

3.1 ROLAP(Relational OLAP )

基于关系数据库的OLAP
有良好的可扩展性/伸缩性,利于增加维

3.2 MOLAP(Multidimensional OLAP)

基于多维数据库的OLAP,采用类似于多维数组的结构
优点:能进行快速索引,响应速度快

3.3 HOLAP(Hybrid OLAP)

对最常用的维,使用多维数据库存储;
对于不常用的维度,采用ROLAP存储;
充分利用ROLAP的可伸缩性和MOLAP的快速计算

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值