数据仓库与数据挖掘的OLAP技术----韩家炜教授的《数据挖掘概念与技术》学习笔记

数据仓库与数据挖掘的OLAP技术

1.数据仓库

Ø 概念:数据仓库是一个面向主题的、集成的、随时间而变化的、不容易丢失的数据集合,支持管理部门的决策过程.

Ø 关键特征:

v 面向主题:围绕一些主题;关注决策者的数据建模与分析,而不是集中于组织机构的日常操作和事务处理(这是数据库的任务)。排除对于决策无用的数据,提供特定主题的简明视图。

v 数据集成:由异种数据源(关系数据库,一般文件,联机事务处理记录)集成构成的;使用数据清理和数据集成技术。

v 随时间而变化:数据仓库的时间范围比操作数据库要长的多,每一个关键结构都隐式或显式地包含时间元素。

v 数据不易丢失:数据是只读的(除了初始转载),不需要事务处理,恢复,和并发控制。

Ø 建立数据仓库

数据集成,数据清理和数据统一

对于异种数据库的集成,传统的数据库做法:包装程序和集成程序 --》查询驱动

数据仓库做法:异种源的信息预先集成 --》更新驱动

Ø 操作数据库系统(OLTP)与数据数据仓库(OLAP)的区别

特征

OLTP

OLAP

用户和系统的面向性

顾客

市场

数据内容

当前详细的数据

历史汇总的数据

数据库设计

ER模型,面向应用的数据库设计

星型。雪花模型和面向主题的数据库设计

视图

当前的,企业内部的数据

经过演化的集成的数据

访问模式

事务操作

事务查询

任务单位

简短的事务

复杂的查询

数据访问量

数十个

数百万条

用户数

数千个

数百个

DB规模

100M-GB

100GB-

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
企业信息化是一项革命性工程,本书以企业信息化为基点,介绍基于ERP数据仓库系统的概念、体系结构、开发方法及步骤。, 全书共分9章。第1章主要介绍企业信息化发展历程、数据库与数据仓库概念、特点、区别、联系及数据仓库系统在企业应用概况;第2章介绍数据仓库开发工具——微软SQL Server 2000数据仓库体系结构及应用技术;第3章介绍数据仓库结构及其创建,包括数据仓库数据库、事实表、维度表及多维数据集创建;第4章介绍数据仓库开发完整过程,包括项目系统规划、用户需求确定、系统分析、系统设计、系统实现、系统试用及扩充;第5章介绍DTS基本概念、DTS包的创建、设置及使用,如何利用DTS包把数据源自动转入数据创库;第6章介绍OLAP的MDX表示与实现,涉及OLAP的基本分析动作的MDX语言表示与实现及OLAP的前端展现方式,提供了丰富的MDX语言程序实例;第7章介绍数据挖掘基础,主要包括数据发掘的概念、数据发掘技术、工具、方法及步骤;第8章介绍常用的知识发现技术数据挖掘方法,主要包括依赖性分析、聚类分析、基于神经网络的数据挖掘方法、基于遗传算法的数据挖掘方法及基于粗糙集的数据挖掘方法;第9章介绍SQL Server 2000数据挖掘技术。, 本书注重工程实践性,实用性强,可以帮助读者全面掌握数据仓库构建与数据挖的方法和步骤,开发出具有实用价值的数据仓库系统。, 本书适用于高等院校信息管理与信息系统专业、电子商务专业、物流管理专业等相关专业本科生教材,也可作为金融类、管理类有关专业研究生教材,同时,对企事业单位数据仓库数据挖掘工作人员、研究人员有重要参考价值。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值