概念
项目 | 数据仓库 | 数据集市 | 备注 |
---|---|---|---|
定义 | 面向主题的、集成的、不可更新的(稳定性)、随时间不断变化的(不同时间)数据集合 | 是一个小型的、部门级别的数据仓库 | |
级别 | 企业级 | 部门级(相当于数据仓库的子集) | |
分类 | 独立型和从属型 | 独立型从操作型中获取数据,从属型从企业级数据仓库中获取数据。从长远看,从属型比独立型要稳定。(因为独立型的数据相对零散,二从属性是跟随于企业级数据仓库的) | |
数据结构模式 | 规范化模式(关系数据库设计模式) | 星型模式、雪片或两者混合(多维数据库设计模式) | |
数据粒度 | 较细 | 较粗 | |
优化 | 处理海量数据 | 便于访问和分析,快速查询 |
备注
- 多个独立型数据集市的集合并不能形成一个数据仓库,只会增加更多的冗余数据。
- 借用Inmon 的比喻:我们不可能将大海里的小鱼堆在一起就构成一头大鲸鱼。这也说明了数据仓库和数据集市有本质的不同。