数据仓库(Data Warehouse)是一种面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史数据(Time-Variant)的数据集合,用于支持管理决策分析。
核心特点
-
面向主题(Subject Oriented)
- 数据仓库按照特定的主题域(如销售、财务、客户等)对数据进行逻辑组织和存储
- 数据按主题域进行集中存储,而不是传统的按应用程序进行分散存储
- 这种主题化的组织方式便于用户进行跨系统、跨部门的数据查询和分析
-
集成的(Integrated)
- 数据仓库将来自不同源系统(如ERP、CRM等)的数据经过提取、转换和加载(ETL)过程集成到一起
- 集成后的数据在概念和内容上保持一致性,形成统一的企业数据视图
- 消除了不同源系统间的数据不一致、冗余等问题
-
相对稳定的(Non-Volatile)
- 数据仓库内的数据是只读的,不会被更新、删除或修改
- 这样可确保数据的完整性和一致性,便于分析和查询
- 新的数据通过ETL过程持续导入
-
反映历史数据(Time-Variant)
- 数据仓库包含了企业长期运营过程中所积累的海量历史数据
- 这些历史数据可用于分析过去的趋势、模式和异常等
- 方便进行回溯分析、趋势预测等决策支持任务
主要目的
数据仓库的核心作用是为企业决策者提供高质量的数据资源,支持各种商业智能分析需求,包括:
- 报表生成
- 多维度数据分析
- 数据挖掘
- 机器学习与预测分析
- 归因分析
- 关键绩效指标分析等