系列文章目录
文章目录
前言
提示:以下是本篇文章正文内容,下面案例可供参考
一、数据仓库是什么?
数据仓库是一个数据系统
二、数据仓库的用处
用于于存储、分析、报告
数据仓库的目的是构建面向分析(OLAP)的集成化数据环境,为企业提供决策支持
三、数据仓库的产生原因
OLTP数据的零散,读取数据的压力,数据周期短,面向多用户,
而支持决策分析需要集合众多业务(即众多表)的 历史数据进行长分析,对实时要求低,面向管理层。
OLTP(On-Line Transaction Processing)
OLTP联机事务处理系统 比如:Oracle、Mysql、SQL Server等。
主要目标是做数据处理,它是针对具体业务进行少数记录查询、修改。
用户较为关心操作的响应时间、数据的安全性、完整性和并发支持的用户数等问题。
OLAP(On-Line Analysis Processing)
面向分析、支持分析的系统称之为OLAP(联机分析处理)系统。数据仓库是OLAP一种
四、数据仓库的数据来源
本身不生产数据,数据从外部来(日志、数据库…)
五、数据库、数据仓库、数据集市的关系
数据库<数据集市<数据仓库
各种数据源头(包括数据库) 经过ETL(抽取Extra, 转化Transfer, 装载Load)处理存储到数据仓库
数据仓库中有不同主题数据,数据集市则根据部门特点面向指定主题,比如Purchasing(采购)、
Sales(销售)、Inventory(库存);
而数据集市通常只涉及一个主题领域,例如市场营销或销售。因为它们较小且更具体,
所以它们通常更易于管理和维护,并具有更灵活的结构。