数据仓库之整体介绍,相关概念

我相信,绝大多数人都听过数据仓库这个概念,也在用着数仓相关产品。本篇主要是整合数仓相关知识,结合自己的业务,对数仓做一个整体的介绍。
本篇主要从数仓基本概念,数仓分层,数仓模型,数仓应用,数仓体系等方面来阐述。

一、关于数仓

1、数据仓库
数据仓库(Data WareHouse),简称DW,是一个面向主题的,集成的,相对稳定的,反映历史变化的数据集合。
2、为什么需要数仓?
(1)数据体量越来越大
(2)数据需要进行查询分析,业务数据库无法支撑高频、快速的查询需求
(3)数据权限限制,数据存储在各个部门或者各个业务系统,使用数据需要经过权限申请
(4)数据质量问题,数据脏乱查,数据不一致等问题存在
3、数仓理解
这一个概念里面,我们要理解,主题是什么,集成是什么,相对稳定是什么,反映历史变化是什么,以及数据仓库是一种什么理解?
(1)主题:这是一个抽象的概念。是在一个比较高的层次上,对公司一类业务进行综合,分析利用的概括。比如,留存分析,活跃分析等。
(2)集成:将全公司的数据集中在一个体系中,解决数据分散,数据不一致,数据权限限制等问题。
(3)相对稳定:数仓里的数据进入数仓之后,用于支撑数据查询,数据的删除和

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值