数据仓库与数据挖掘学习笔记(一)数据仓库概述

1、数据仓库有哪些主要的特征

(1)、面向主题的
(2)、集成的
(3)、稳定性不容易丢失(非易失)
(4)、按时间变化而变化(即时变)

2、简述数据仓库的传统数据库的主要区别

区别传统数据库数据仓库
数据量很少数据量大
支持的操作CURD主要用于查询不能删除更改
主题域面向应用面向主题
主要功能服务客户/操作人员主要是公司决策使用
数据冗余非冗余冗余
计算程度不复杂大量复杂的计算
更新度数据可更新数据一般是不可以更改的
操作度操作很频繁相对不频繁

3、为什么需要分离的数据仓库

问题:操作型数据库存放了大量的数据,为什么不直接在这种数据库上进行联机分析处理。而是另外花费大量时间跟资源去构造一个与之分离的数据仓库呢?其主要原因是提高俩个系统的性能。
操作数据库是为已知的任务和负载设计的。如使用关键字索引,检查特定的记录和sql优化,支持多事务和并行处理。需要加锁和日志等并发控制。以确保数据的完整性和一致性
数据仓库的查询通常是非常复杂的。涉及大量的历史数据汇总级别的计算,可能需要特殊的数据存储,组织,和基于多维视图的方法实现,对数据只是简单的做查询,以及汇总计算
如果OLAP和OLTP都作用与关系型数据库,那么会大大降低数据库系统的吞吐量。
总之。数据仓库跟关系型数据库这2个的功能是不一样的,操作行一般不维护历史数据,所有的CURD都是基于当前的数据的,但对于决策根本不够,数据仓库用于决策使用,将不同来源的数据统一汇总计算,最后产出数据报表

4、简述数据仓库的体系结构

主要分为4大类:源数据、数据存储管理、OLAP、前端分析工具
源数据:包括数据来源,数据库,日志等等
存储管理:数据仓库,数据集式,元数据管理等
OLAP:联机分析处理
前端工具:数据报表,数据分析,数据挖掘等

5、简述商务智能和数据仓库的关系
可以理解为数据仓库是商务智能的基础,
其商务智能的核心就是从许多来自企业不同的业务处理系统的数据中,提取有用的数据,进行
清洗–抽取–转换–装载 4步骤即ETL过程,将数据整合到中心数据仓库,再次基础上利用合理的查询和分析工具,数据挖掘技术等对数据仓库的数据进行分析和处理,形成信息,然后进一步把规律性的信息提炼成知识。并把对决策有用的信息呈现出来给管理者。
所以商务智能是数据仓库,联机分析处理,数据挖掘等相关技术的一个综合应用的体现

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值