数据仓库与数据库的区别
- 着重点不同:
- 数据库着重于数据的业务处理(数据的增删改)、也就是数据的OLTP处理
- 数据仓库着重于数据的分析,通常都是面向某一个行业,领域(查询),也就是数据的OLAP处理
- 存储结构不同:
- 数据库是面向行式存储。
- 数据仓库是面向列式存储,利于查询和分析. 数据仓库也可以称之为"分析型数据库"
- 使用的用户不同
- 数据库主要是业务人员,人数相对大。会经常进行读和写操作。每次读和写的数据量都相对来说少。
- 数据仓库主要是管理人员,人数相对少。会经常进行读操作,每次读取的数据量巨大
- 使用的工具不同
- 数据库主要用的是oracle、mysql、sqlserver等传统关系型数据库
- 数据仓库主要用的是hive、mr、spark、flink
- 数据的存储位置不同
- 数据库的数据存储到本地文件系统,比如windows、linux、mac
- 数据仓库的数据存储到分布式文件系统,比如hdfs,hbase
- 反映时间不同
- 数据库的反映时间是非常短的,毫秒级别
- 数据仓库的反映时间较长,秒级别,分钟级别