数据仓库是面向主题的、集成的、稳定的、不同时间的数据集合,用于支持经营管理中决策制定的过程。
数据库和数据仓库的区别
数据库(DB) | 数据仓库(DW) |
面向应用 | 面向主题 |
数据是详细的 | 数据是综合的或提炼的 |
保持当前数据 | 保存过去和现在的数据 |
数据是可以更新的 | 数据不更新 |
对数据操作是重复的 | 对数据的操作是启发式的 |
操作需求是事先可知的 | 操作需求是临时决定的 |
一个操作存取一个记录 | 一个操作存取一个集合 |
数据非冗余 | 数据时常冗余 |
操作比较频繁 | 操作相对不频繁 |
查询基本上是原始数据 | 查询基本上是经过加工的数据 |
事务处理需要的是当前数据 | 决策分析需要过去、现在的数据 |
很少有复杂的计算 | 很多复杂的计算 |
支持事务处理 | 支持决策分析 |
数据仓库的结构组成
当前基本数据、历史基本数据、轻度综合数据、高度综合数据、元数据。
联机分析处理(OLAP)是一种软件技术,他使分析人员能够迅速、一致、交互的从各个方面观察信息。以达到深入理解数据的目的。
变量是数据的实际意义,即描述数据“是什么”。
维是人们观察数据的特定角度。
人们观察数据的某个特定角度(即某个维)还可以存在细节程度不同的多个描述方面,称这个多个描述方面为维的层次。
维的一个取值称为该维的一个维成员。
一个多维数组可以表示(维1,维2,...,维n,变量)。
多维数组的取值称为数据单元。
选定多维数组的一个二维子集的操作叫做切片。
切块 在多维数据的某一个维上选定某一区间的维成员的操作 选定多维数组的一个三维子集
钻取 向下钻取是使用户在多层数据中能通导航信息而获得更多细节性数据
通过旋转可以得到不同视角的数据。