数据挖掘概念与技术第三版 范明 孟晓峰译 第四章 数据仓库与联机分析处理学习笔记

本文介绍了数据仓库和数据集市的区别,数据仓库的三层体系结构,以及OLAP操作,包括上卷、下钻、切片、切块和转轴。强调了OLAP和数据挖掘在数据分析中的不同角色,数据仓库利用索引技术提高查询效率。
摘要由CSDN通过智能技术生成
1.数据仓库:一个数据集合,四个特点:面向主题的(指面向具体应用)、集成的(指是多个数据库数据集成在一起)、时变的(数据来自历史多个时间范围)、非易失的(分离存放数据,不需要事务处理,数据不容易丢失)。
2.联机事务处理(OLTP)与联机分析处理(OLAP)的最原始区别:
  OLTP面向顾客,主要用于对单条数据的增删改查操作;OLAP面向市场,主要是对集中的大量数据进行分析处理。

3.元数据:关于数据的数据,其实就是描述数据的一些特性,如提取数据时所加的时间标签、提取数据的源、集成数据所添加的缺失字段都是元数据。

4.数据仓库和数据集市区别:

  数据仓库收集整个组织的主题信息,企业范围,通常使用事实星座模式。

  数据集市是数据仓库的一个部门子集,部门范围,流行采用星形或雪花模式。

5.典型的OLAP操作:

    上卷(上钻):将一个维的概念向上分

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值