数据仓库基础笔记思维导图已经整理完毕,完整连接为:
数据仓库基础知识笔记思维导图
OLAP(联机分析处理)
数据仓库为分析操作提供了最好的机会,而OLAP就是用来执行相关分析的工具。
- 可以进行多维分析,日常的业务,只有多个维度关联起来时才有意义
- 快速访问和强大的计算能力,有效的分析处理环境不但是快速的,灵活的,而且可以支持复杂的,强大的计算
- 其他分析方法的局限性
包含在查询请求里的典型计算
- 进行概括化操作以沿着维度的各种层次来汇总和聚集
- 沿着各个维度各个层次从最高层向最低层下钻
- 简单的计算,例如利润的计算
- 部分占整体的百分比的比例计算
- 包含键码性能指示器的代数方程
- 不固定的平均值和增长的百分比
- 使用统计方法来分析事物发展趋势
OLAP的基本优点
- 使分析员,主管人员和经理能够深入地了解数据的显示方法
- 能够沿着几个维度重新构造指标。并允许用户从不同的角度来查看数据
- 支持多维分析
- 能够在每个维度里面进行下钻和概括化分析
- 能够在测量中应用数学公式和计算
- 能够对分析做出快速的反应,提供边思考边分析的方式
- 与其他信息传递技术,如数据挖掘互补
- 通过图像和表格来实现数据可视化的表现形式,使用户能够更容易地理解结果集的含义
- 能够在Web上运行
- 能够实现交互式分析
OLAP的定义和规则
联机分析处理OLAP是一种软件技术,它使分析员,经理,主管人员,能够通过快速的,一致的和交互的访问来获取并理解各种可能信息视图的数据,这些信息由原始数据转换而成,用来反映一个企业实际的维度。
OLAP系统最初的原则
- 多维概念的视图,能够提供一个直观分析的,易于使用的多维数据模型
- 透明度,让技术,后台数据存储库,计算体系和元数据不同本质对全部对用户透明
- 可访问性,只让用户访问在执行一个特定的分析过程中实际需要的那些数据,并向用户显示单一的,一致的和连贯的视图
- 客户_服务器系统体系结构
- 等价的维度,确保每个维度在结构和操作性能上是等价的
- 动态稀疏矩阵的处理
- 支持多用户
- 无限制的跨纬度操作
- 直观的数据操作
- 灵活的报表
- 无限的维度的聚集的层次
- 下钻到细节层次
- OLAP分析模型
- 非标准化数据的处理
- 存储OLAP结果
- 遗失值
- 数据库增量更新
- SQL接口
OLAP的主要特征与功能
OLAP在某种意义上是数据仓库信息传递系统,数据仓库存储数据并为用户提供对数据的简单访问,但OLAP系统将信息传送能力提到了新的高度,因而是数据仓库的补充。
一般特征
- 多维分析
- 一致的性能
- 交互查询具有快速的反应时间
- 下钻和概括化查询
- 在细节内外导航
- 多层次多视角查看
- 多种查看模式
- 扩展简单容易
- 时间智能
高级特性
- 强大的计算
- 跨维度计算
- 预计算和预合并
- 跨纬度或细节分析
- 精良的显示
- 共同地指定决策
- 通过公式推导数值
- 报警技术和应用
- 使用代理技术生成报表
超立方体
多条直线显示了多个商业维度,而最后一条直线显示了指标,可以独立地沿着直线上移或者下移,称作多维域模型(MDS)。
如何在三个显示组显示四维数据,在同一个显示组里结合多个逻辑维度。
多维分析有意义方面
- 下钻和概括
- 多层次多视角查看操作
下钻和概括化操作
既能够概括化到高层次的聚集,也能够下钻到较低层次的细节。OLAP能够通过使用其他维的不同层次集,以跨越到其他维度并下钻另外的OLAP的汇总。也可以下钻到存储在源数据仓库存储库中较低粒度的这项操作。
OLAP的类型
- ROLAP(relational online analytical processing)
- MOLAP(multidimensional online analytical processing)
MOLAP
在MOLAP中,执行一些特殊的抽取和聚集工作,以在多维数据库中创建这些多维数据立方体。在应用层的MOLAP引擎会主动将多维数据库中的数据多维视图传送给用户。
MOLAP是为了快速反应和更密集的查询使用的。
ROLAP
预先编制的多维立方体并不是提前创建好的,也没有存储在一个特殊的数据库里,关系数据就是用这些形象的多维数据立方体来显示的。应用层中的复习服务器在工作中创建了多维的视图。当用户基于这个多维视图发出复杂查询请求时,查询被转换成复杂的SQL语句传给关系数据库。
分离OLAP应用与数据仓库平台的时机原则
- 当主数据仓库的容量和使用逐步上升,使得数据仓库需要该公共平台的所有资源
- 如果太多的部门需要OLAP系统
- 用户希望OLAP系统稳定运行,性能良好
- OLAP用户分散于不同地域的企业中
- OLAP系统的一些实例中的用户想要远离其他用户
- 如果OLAP工具需要的配置和主数据仓库的平台不同
OLAP实施步骤
- 维度建模
- 设计并建立多维数据库(MDDB)
- 选择要转移到OLAP系统中的哪些数据
- 获取或抽取数据并向这些数据送到OLAP系统中
- 为OLAP系统装载数据
- 对数据聚集和导出的数据的计算
- 桌上型电脑上应用程序的实施
- 对用户进行培训