数据仓库:data warehouse ,DW. 数据库技术。---虽一字之差,但不同于数据库,数据仓库是为了构建新的分析处理环境而出现的一种数据存储和组织技术。
数据仓库的建立,能充分利用已有的数据资源,把数据转换为信息,从中挖掘出知识,提炼出需要的结果。
计算机系统中存在着两类不同的数据处理工作:操作型处理和分析型处理。也称作
OLTP:联机事务处理---------对数据库联机的日常操作,通常是对一个或一组记录的查询和修改,例如:火车售票系统、银行通存通兑系统、税务管理系统等。这些系统要求快速响应用户请求,对数据库的安全性、完整性及事务吞吐量要求很高。
和
OLAP:联机分析处理--------对数据的查询和分析操作,通常是对海量的历史数据查询和分析,例如金融风险预测预警系统、证券股市违规分析系统。这些系统要访问的数据量非常大,查询和分析十分复杂。
二者区别:
-----------
----------------------------
数据仓库是一个用以更好地支持企业(或组织)决策分析处理的、面向主题的、集成的、不可更新的、随时间不断变化的数据集合。
本质上和数据库一样,是长期储存在计算机内的、有组可共享的数据集合。
---------------------
数据仓库的特征:
数据仓库的数据是面向主题的;
集成的;
不可更新的;
随时间不断变化的。
--------------------------------------------
主题与面向主题:
主题:是一个抽象的概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析利用的抽象;在逻辑意义上,它对应企业中某一宏观分析领域所涉及的分析对象。比如一家商场,概括分析领域的对象应有的主题包括供应商、商品、顾客等。
面向主题的数据组织方式是根据分析要求将数据组织成一个完备的分析领域,即主题域。
主题域两个特点:独立性、完备性。