数据挖掘与数据仓库——数据仓库、 OLAP及数据立方体计算

数据仓库、 OLAP及数据立方体计算

什么是数据仓库

有多种但并不严格的定义

  1. 与操作数据库相隔离并单独维护的一个用来支持决策过程的数据库。
  2. 一个用来对整理过的历史数据进行分析以便支持信息处理的固定平台。
  3. “数据仓库是面向主题的、集成的、时变的、非易失的数据集合,它用来支持管理部门的决策过程”—W. H. Inmon
数据仓库的特征
  1. 面向主题的:围绕主题组织, 如消费者(customer)、产品( product), 销售量(sales)等。主要目的是对数据建模与分析,以便于决策者的决策过程,而不是日常操作与事物处理。

  2. 集成的:集成多个、异构数据源

  3. 时变的:数据仓库跨越的时间比操作数据库要长的多。
    操作数据库: 当前值数据。
    数据仓库: 从历史的视角提供信息(如过去5-10的数据)

  4. 非易失的:与操作数据库分隔存储。操作数据库的数据更新不在数据仓库环境出现。仅仅需要以下2种操作: 数据的初始装载与数据访问。

数据仓库 vs. 数据库管理系统

联机事物处理 (OLTP ,on-line transaction processing)

  • 传统关系数据库的主要任务
  • 日常操作 : 购买, 存货, 财务等.

联机分析处理 (OLAP,on-line analytical processing)

  • 数据仓库的主要任务
  • 数据分析与决策支持
  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值