不同点:
特性 | 传统数仓 | 大数据数仓 |
---|---|---|
数据存储位置 | 关系型数据库 | HDFS |
数据集市位置 | MPP平台 | HDFS |
数据多样性 | 结构化数据 | 结构化数据、非结构化数据、半结构化数据 |
节点数量 | 几千 | 几千~几万 |
数据量 | TB级别 | PB级别 |
商业价值 | 较为单一 | 极高 |
用途 | BI | AI |
应用开发接口 | SQL | SQL,多种编程接口 |
事务支持 | 支持完整 | 支持有限 |
操作难易度 | 较高,需要专业人员 | 较低,可以批量培训 |
相同点:
- 逻辑架构
- 数据建模
- 数据治理
- 数据标准规范
“大数据数仓”是在“传统数仓”基础上发展而来,绝大部分数据建设理论仍然是一脉相承,它们处理的对象都是“海量数据”,服务目的和商业价值也基本相同;但“大数据”技术又在产品创新、高性能、低成本、拓展性、场景多样性等方面取得了巨大突破,更是让只有大型企业玩得转的大数据项目可以“平民化”从而推进商业形态朝前进化。