信息系统项目管理师自学笔记(十七)——数据仓库与数据挖掘

本文介绍了数据仓库的概念,强调其面向主题、集成、稳定和随时间变化的特性。数据仓库的体系结构包括数据源、存储与管理和前端工具。数据仓库的开发涉及业务需求分析、逻辑和物理模型设计以及数据抽取等步骤。数据挖掘是从大量数据中提取未知、有用信息的过程,包括关联分析、序列分析、分类、预测和聚类等方法。数据挖掘流程包括问题定义、数据收集、数据分析、数据调整、模型建立和评估。
摘要由CSDN通过智能技术生成

为了满足中高层管理人员预测、决策分析的需要,在传统数据库的基础上产生了能够满足预测、决策分析需要的数据环境——数据仓库。

3.7.1 数据仓库的概念

数据仓库(Data Warehouse)是一个面向主题的、集成的、相对稳定的,且随时间变化的数据集合,用于支持管理决策。

  1. 面向主题的。操作型数据库的数据组织面向事务处理任务(面向应用),各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织。
  2. 集成的。在数据仓库的所有特性中,这是最重要的。数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。
  3. 相对稳定的(非易失的)。
  4. 反映历史变化或者说是随着历史变化。

3.7.2 数据仓库的体系结构

  1. 数据源:是数据仓库系统的基础,是整个系统的数据源泉。通常包括企业内部信息和外部信息。内部信息包括存放于数据库管理系统中的各种业务处理数据和各类文档数据。外部信息包括各类法律法规、市场信息和竞争对手的信息等。
  2. 数据的存储与管理:是整个数据仓库系统的核心。数据仓库的真正关键是数据的存储和管理。
  3. *OLAP服务器:对分析需要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。
  4. 前端工具:主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。其中数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具主要针对数据仓库。

*标星位置种OLAP服务器

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

烧麦Sn0wSt@r

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值