数据分析师也要懂的数据仓库_数仓基本概念与分层

本文介绍了数据仓库的基本概念,包括数据仓库、数据集市、数据湖和数据中台的定义。同时,详细阐述了数仓的分层结构,如数据采集层、数据计算层的各阶段,并解释了数据烟囱和数据模型的概念,旨在帮助数据分析师更好地理解和沟通数仓知识。
摘要由CSDN通过智能技术生成

写在前面

数据分析师的日常工作中,与数仓同学的沟通非常密切。
本文通过阅读《大数据之路–阿里巴巴大数据实践》书籍,并列举实际工作中遇到的例子来详细解读数据分析师应该理解的数仓知识。旨在最终帮助分析师与数仓同学无GAP地沟通。

总述

在这里插入图片描述

数仓的基本概念

数据仓库:数据按照特定的模型组织起来。虽然对于使用者不友好,但是对于数仓管理人员相对友好,因为它按照一种集约化的规则将数据管理起来。
数据集市:面向最终用户的数据市场。数据以业务人员接受的方式组合在一起。这个组合方式是多变的,因为业务人员的需求是多变的。
数据湖:存储的是未经加工的原始数据,包含结构化和非结构化的各类数据。有点像把宜家的家具零件全部拆散存储。但是原始数据如果缺少统一的数据标准,就像不同的家具零部件之间的接口不同,那就无法组装在一起了。
数据中台:狭义的数据中台指的是一套数据应用和工具,包括分布式ETL、数据资产管理、数据标签管理、数据沙箱、自助分析平台、元数据管理、数据质量管理等。底层则有数据仓库、大数据平台等为数据源,为企业提供数据资产管理的能力。
广义的数据中台,则在狭义的数据中台基础上,包含了顶层数据战略、数据治理体系以及数据管理及运营、数据文化培养和组织架构支撑。
摘录自:https://zhuanlan.zhihu.com/p/189640832

数仓的分层

1.数据采集层
日志采集

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值