数据仓库与数据挖掘记录 一

1.数据仓库(Data Warehouse)

在这里插入图片描述
数据仓库是一个 面向主题(subject-oriented)、集成的(integrated)、非易失性(nonvolatile) 且 随时间变化(time-variant) 的数据集合,支持管理决策(management’s decisions)。

1.1数据仓库的组成
1.数据仓库数据库

数据仓库数据库是整个数据仓库环境的核心,是数据信息存放的地方,对数据提供存取和检索支持。相对于传统数据库来说,其突出的特点是对海量数据的支持和快速的检索技术。

2.数据抽取工具

数据抽取工具是把数据从各种各样的存储环境中提取出来,进行必要的转化.整理,再存放到数据仓库内

3.元数据

元数据是描述数据仓库内数据的结构和建立方法的数据。元数据为访问数据仓库提供了一个信息目录,这个目录全面描述了数据仓库中有什么数据,这些数据是怎么得到的、怎么访问这些数据。元数据是数据仓库运行和维护的中心内容,数据仓库系统对数据的存取和更新都需要元数据信息。据元数据用途的不同可将元数据分为技术元数据和业务元数两类

4.访问工具

访问工具是为用户访问数据仓库提供的手段,如数据查询和报表工具、应用开发工具、数据挖掘工具和数据分析工具等。

5.数据集市(data mart)

数据集市是为了特定的应用目的,从数据仓库中独立出来的一部分数据,也称为部门数据或主题数据。在数据仓库的实施过程中往往可以从一个部门的数据集市着手,再逐渐用几个数据集市组成一个完整的数据仓库。需要注意的是,在实施不同的数据集市时,相同含义字段的定义一定要相容,以免未来实施数据仓库时出现问题。

6. 数据仓库管理

数据仓库管理包括安全与权限的管理,数据更新的跟踪、数据质量的检查、元数据的管理与更新.数据仓库使用状态的检测与审计、数据复制与删除.数据分割与分发,数据备份与恢复 .数据存储管理等。

7.信息发布系统

信息发布系统是把数据仓库中的数据或其他相关的数据发送给不同的地点或用户。基于 Web 的信息发布系统是当前流行的多用户访问的最有效方法。

2.数据集市(Data Mart)

  1. 什么是数据集市?
    数据集市(Data Mart) 是数据仓库的一个子集,专门为特定业务部门(如财务、营销、人力资源)或特定用
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值