离线数仓03-数仓分层业务逻辑

9 篇文章 20 订阅 ¥19.90 ¥99.00

1 数仓分层

image-20201229090221736

1.1 为什么要分层?

(1)把复杂的问题简单化

  • 把复杂的任务分解为多层完成,方便定位问题~

  • 少写了很多复杂的sql

(2)减少重复开发

  • 规范数据分层,通过中间数据,可以减少极大的重复计算,增加复用性

    中间结果保存出来,以后拿数据就能从中间获取,不用从最开始的数据拿

(3)隔离原始数据

  • 将真实数据和要使用的统计数据解耦开;

  • 权限管理:控制哪些人可以访问哪些表。

--数据怎么到ODS层?
离线数仓分层设计通常包括贴源层(ODS)、明细层(DWD)、维度层(DIM)、轻度聚合层(DWS)、主题层(DWT)、数据间层(DWM)和结果展示层(ADS)\[1\]。 贴源层(ODS)是数仓最底层的层次,用于接收和存储原始数据。在这一层,数据被抽取、清洗和转换为可用于后续处理的格式。 明细层(DWD)是在贴源层之上的一层,用于存储经过处理和加工的原始数据。在这一层,数据被进行清洗、整合和转换,以满足业务需求。 维度层(DIM)是用于存储维度数据的层次。维度表是基于原始数据层提取公共指标进行维度建模的结果\[2\]。在这一层,维度数据被提取出来,并与事实数据进行关联。 轻度聚合层(DWS)是在明细层之上的一层,用于存储经过聚合的数据。在这一层,数据被进行聚合操作,以提高查询性能和减少数据量。 主题层(DWT)是在轻度聚合层之上的一层,用于存储按照业务主题组织的数据。在这一层,数据被按照业务主题进行组织和汇总,以支持特定的分析和报表需求。 数据间层(DWM)是用于存储数据处理过程间结果的层次。在这一层,数据被用于支持数据处理的各个阶段,例如数据清洗、转换和集成。 结果展示层(ADS)是数仓最顶层的层次,用于存储最终的分析结果和报表数据。在这一层,数据被用于生成各种分析报表和可视化展示。 离线数仓分层设计可以根据具体业务需求和数据处理流程进行灵活调整,但通常遵循以上的基本分层结构\[1\]。 #### 引用[.reference_title] - *1* *2* [离线数仓分层(基础)](https://blog.csdn.net/wind96/article/details/127641942)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [离线数仓 (八) --------- 数仓分层](https://blog.csdn.net/m0_51111980/article/details/127491547)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

最佳第六六六人

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值