离线数据仓库(Hive 搭建)
1. 数据仓库概述
1. 数据仓库概念
数据仓库(Data Warehouse),简写为 DW 或 DWH,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。为需要业务智能的企业提供指导业务流程改进、监视时间、成本、质量及控制。
数据仓库(Data Warehouse):一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。
- 面向主题:在较高层次上将企业信息系统的数据综合归并进行分析利用的抽象的概念。每个主题基本上对应一个相应的分析领域
- 集成的:企业级数据,同时数据要保持一致性、完整性、有效性、精确性
- 稳定的:从某个时间段来看是保持不变的,没有更新和删除操作,以查询分析为主