关系型数据库:指用关系模型来组织数据信息的数据库。
关系模型指的是二维表格模型,而一个关系型数据库便是由二维表以及表之间的关系所构成的一个数据集合。
非关系型数据库:指非关系型的,分布式系统的,且一般不确保遵照ACID标准的数据储存系统。
非关系型数据库算是一种数据结构化储存的集合,可以是文档或键值对等。
非关系型数据库的本质是传统关系型数据库的功能阉割版本,通过去掉不需要的功能来提高性能。
非关系型数据库的类型:
1,键值储存数据库
2,列储存数据库
3,文档型数据库
4,图数据库
两种数仓架构思想
Bill Inmon 将数据仓库定义为“一个面向主题的、集成的、非易变的、随时间变化的用于支持管理的决策过程的数据集合”。他认为应该围绕主题来组织数据仓库中的数据,数据仓库应该一次增加一个主题,并且当需要容易地访问多个主题时,应该创建以数据仓库为来源的数据集市。换言之,某个特定数据集市中的所有数据都应该来自于面向主题的数据存储。这是一项自顶向下的建设,需要开发人员对业务有非常深入且全面的了解。
Ralph Kimball 说“数据仓库仅仅是构成它的数据集市的联合”,他认为“可以通过一系列维数相同的数据集市递增地构建数据仓库”。各部门或业务可以根据自身的发展,建设符合自身主题的数据集市,并持续丰富完善这些数据集市。在应对企业级数据需求时,将这些数据集市的维度信息进行统一整理规范,然后通过一致的维度信息,将这些数据集市连接起来,使数据集市形成一个覆盖企业所有部门或业务的数据仓库,对外提供服务。是一种自下而上的建设理论。
企业在发展初期一般业务量小、组织形式相对简单。数仓建设人员可以站在全局的高度以自上而下