数仓建设理论总结

本文介绍了数仓的两种架构思想——Inmon和Kimball的理论,以及常见的数据建模方法,包括范式建模和维度建模。详细阐述了各方法的优缺点和适用场景,为企业数仓建设提供了理论指导。
摘要由CSDN通过智能技术生成

关系型数据库:指用关系模型来组织数据信息的数据库。
关系模型指的是二维表格模型,而一个关系型数据库便是由二维表以及表之间的关系所构成的一个数据集合。

非关系型数据库:指非关系型的,分布式系统的,且一般不确保遵照ACID标准的数据储存系统。
非关系型数据库算是一种数据结构化储存的集合,可以是文档或键值对等。
非关系型数据库的本质是传统关系型数据库的功能阉割版本,通过去掉不需要的功能来提高性能。
非关系型数据库的类型:
1,键值储存数据库
2,列储存数据库
3,文档型数据库
4,图数据库

两种数仓架构思想

Bill Inmon 将数据仓库定义为“一个面向主题的、集成的、非易变的、随时间变化的用于支持管理的决策过程的数据集合”。他认为应该围绕主题来组织数据仓库中的数据,数据仓库应该一次增加一个主题,并且当需要容易地访问多个主题时,应该创建以数据仓库为来源的数据集市。换言之,某个特定数据集市中的所有数据都应该来自于面向主题的数据存储。这是一项自顶向下的建设,需要开发人员对业务有非常深入且全面的了解。
Ralph Kimball 说“数据仓库仅仅是构成它的数据集市的联合”,他认为“可以通过一系列维数相同的数据集市递增地构建数据仓库”。各部门或业务可以根据自身的发展,建设符合自身主题的数据集市,并持续丰富完善这些数据集市。在应对企业级数据需求时,将这些数据集市的维度信息进行统一整理规范,然后通过一致的维度信息,将这些数据集市连接起来,使数据集市形成一个覆盖企业所有部门或业务的数据仓库,对外提供服务。是一种自下而上的建设理论。

企业在发展初期一般业务量小、组织形式相对简单。数仓建设人员可以站在全局的高度以自上而下

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值