数据仓库是一个面向主题的、集成的、随时间变化的、非易失的数据集合,用于支持管理者的决策过程。
集成:将多个分散的数据源统一成一致的、无歧义的数据格式后放置到数据仓库中,解决命名冲突、计量单位不一致等问题;
随时间变化:数据仓库中的数据反映了某一历史时间点的数据快照;
非易失:一旦进入数据仓库中,数据就不应该再有改变。
数据仓库中的粒度是指数据的细节或汇总程度,细节程度越高,粒度级别越低。
数据仓库中的数据来自各个业务应用系统。
很多因素导致直接访问业务系统无法进行全局数据分析的工作,这也是需要一个数据仓库的原因所在。
数据仓库的基本需求是安全性、可访问性、自动化,对数据的要求是准确性、时效性、历史可追溯性。