数据仓库和数据挖掘的OLAP技术
引言
- 数据仓库中的数据清理和数据集成,是数据挖掘的重要数据预处理步骤
- 数据仓库提供OLAP工具,可用于不同粒度的数据分析
- 很多数据挖掘功能都可以和OLAP操作集成,以提供不同概念层上的知识发现
- 分类
- 预测
- 关联
- 聚集
一、什么是数据仓库
数据仓库的定义很多,但却很难有一种严格的定义:
- 它是一个提供决策支持功能的数据库,它与公司的操作数据库分开维护。
- 为统一的历史数据分析提供坚实的平台,对信息处理提供支持
数据仓库区别于其他数据存储系统:
“数据仓库是一个面向主题的、集成的、随时间而变化的、不容易丢失的数据集合,支持管理部门的决策过程.”—W. H. Inmon
二、数据仓库的关键特征
2.1、面向主题
面向主题,是数据仓库显著区别于关系数据库系统的一个特征
- 围绕一些主题,如顾客、供应商、产品等
- 关注决策者的数据建模与分析,而不是集中于组织机构的