1、数据仓库有哪些主要的特征
(1)、面向主题的
(2)、集成的
(3)、稳定性不容易丢失(非易失)
(4)、按时间变化而变化(即时变)
2、简述数据仓库的传统数据库的主要区别
区别 | 传统数据库 | 数据仓库 |
---|---|---|
数据量 | 很少 | 数据量大 |
支持的操作 | CURD | 主要用于查询不能删除更改 |
主题域 | 面向应用 | 面向主题 |
主要功能 | 服务客户/操作人员 | 主要是公司决策使用 |
数据冗余 | 非冗余 | 冗余 |
计算程度 | 不复杂 | 大量复杂的计算 |
更新度 | 数据可更新 | 数据一般是不可以更改的 |
操作度 | 操作很频繁 | 相对不频繁 |
3、为什么需要分离的数据仓库
问题:操作型数据库存放了大量的数据,为什么不直接在这种数据库上进行联机分析处理。而是另外花费大量时间跟资源去构造一个与之分离的数据仓库呢?其主要原因是提高俩个系统的性能。
操作数据库是为已知的任务和负载设计的。如使用关键字索引,检查特定的记录和sql优化,支持多事务和并行处理。需要加锁和日志等并发控制。以确保数据的完整性和一致性
数据仓库的查询通常是非常复杂的。涉及大量的历史数据汇总级别的计算,可能需要特殊的数据存储,组织,和基于多维视图的方法实现,对数据只是简单的做查询,以及汇总计算
如果OLAP和OLTP都作用与关系型数据库,那么会大大降低数据库系统的吞吐量。
总之。数据仓库跟关系型数据库这2个的功能是不一样的,操作行一般不维护历史数据,所有的CURD都是基于当前的数据的,但对于决策根本不够,数据仓库用于决策使用,将不同来源的数据统一汇总计算,最后产出数据报表
4、简述数据仓库的体系结构
主要分为4大类:源数据、数据存储管理、OLAP、前端分析工具
源数据:包括数据来源,数据库,日志等等
存储管理:数据仓库,数据集式,元数据管理等
OLAP:联机分析处理
前端工具:数据报表,数据分析,数据挖掘等
5、简述商务智能和数据仓库的关系
可以理解为数据仓库是商务智能的基础,
其商务智能的核心就是从许多来自企业不同的业务处理系统的数据中,提取有用的数据,进行
清洗–抽取–转换–装载 4步骤即ETL过程,将数据整合到中心数据仓库,再次基础上利用合理的查询和分析工具,数据挖掘技术等对数据仓库的数据进行分析和处理,形成信息,然后进一步把规律性的信息提炼成知识。并把对决策有用的信息呈现出来给管理者。
所以商务智能是数据仓库,联机分析处理,数据挖掘等相关技术的一个综合应用的体现