数据仓库(Data Warehouse)是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。可以从两个层次理解数据仓库。首先,数据仓库用于决策支持,面向分析型数据处理,不同于企业现有的操作型数据库;其次,数据仓库是对多个异构数据源(包括历史数据)的有效集成,集成后按主题重组,且存在的数据仓库中的数据一般不再修改。
1、数据仓库是面向主题的。传统的操作型系统是围绕公司的应用进行组织的。
2、数据仓库是集成的。数据仓库实现数据由面向应用的操作型环境向面向分析的数据仓库集成。数据仓库中的数据是按照一定的主题域进行组织的。数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到,消除了源数据当中的不一致性,从而保证了数据仓库内的信息是关于整个企业的一致的全局信息。
3、数据仓库是非易失的、相对稳定的。数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,只有少量的修改和删除操作,通常只需定期加载,刷新。
4、反映历史变化。数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时刻到当前各个阶段的信息,这这些信息,可以对企业的发展历程和未来趋势作出定量分析和预测。数据仓库中的数据随时间变化的特性还表现在:数据仓库中的数据时间期限要远远长于操作型系统中的数据时间期限。操作型系统的时间期限一般是60-90天,而数据仓库中的数据时间期限通常是5-10年。

前端工具主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数扭集市的应用开发工具。其中数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具主要针对数据仓库。
部门级数据仓库称为数据集市。