一、 数仓是什么,为什么需要数仓
个人理解,数仓和数据库都是组织数据的方法论,数仓和数据库(关系型数据库)处理的问题不同,所以当面对数据库不那么适合处理的问题时,就出现了数仓 。
数仓具有如下特点:
- 数据组织应用的方法论
- 按照主题进行组织 (主题是相对应用而言的)
- 对数据库进行抽取和清理
- 主要是进行数据查询
二、数仓 vs 关系型数据库 Mysql —— 即 OLTP 和 OLAP
首先,要想理解理解两者的区别,我们先要理解范式的概念,范式是构造数据库的规则。范式一共具有以下几种:
对关系型数据库 Mysql 来说,我们设计数据库时需要满足三大范式。那我们顺势就可以想到,这样设计出的数据库肯定具有数据冗余低,表数量多等特点 。这样的数据处理存储方式就被称为 —— OLTP 联机事务处理 。
而对数仓来说,数仓的数据设计采用维度建模的方法,这样的设计决定了数仓具有 数据冗余量大,面向业务的特点,这种数据处理方式就被称为 —— OLAP 联机分析处理 。
参考文章: