背景
接触大数据两年的时间里,数据仓库这个词频繁出现在我的耳朵里,随着知识的逐渐积累,对数据仓库和数据库也有了一个大概的了解。
概念
- 数据库(DB)
简单来说,数据库就是存储数据的仓库,主要有关系型数据库和非关系型数据库,这是一种逻辑上的概念。 - 数据仓库(DW)
从逻辑上来理解,和数据库的概念一致,都是存储数据的仓库,只是数据仓库的数据量更大。
数据仓库的特点
- 数据仓库是面向主题的
那么什么是主题呢,简单来说,主题就是用户在使用数据仓库时所关心的方面。 - 数据仓库时不支持修改的
这点好理解,数据仓库不像数据库,不支持update和delete操作。 - 数据仓库的数据是随时间的变化而变化的
这与上一条并不冲突,这个变化不是指update或是delete儿产生的变化,而是随着时间的变化,不断的增加新的内容,或是删除旧的内容。 - 数据仓库是多个异构数据源所集成的
- 数据仓库存储的一般是历史数据
- 数据仓库是弱事务的,因为数据仓库存的是历史数据,一般都读(分析)数据场景。
- 数据库是为捕获数据而设计,数据仓库是为分析数据而设计。
数据库和数据仓库的区别
数据库是为捕获数据而设计,数据仓库是为分析数据而设计。 数据库和数据仓库的区别本质上是OLTP与OLAP的区别