数仓建设规范

吵吵叭火

已于 2024-05-06 11:15:56 修改

阅读量1.4k

点赞数 45

分类专栏：大数据文章标签：大数据数据仓库

于 2024-02-04 21:58:02 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SHWAITME/article/details/136030258

版权

大数据专栏收录该内容

55 篇文章 4 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文详细阐述了数据模型设计规范，包括数仓分层原则、主题域划分、设计原则，以及数仓公共开发规范，如层次调用、数据类型、冗余处理和空值策略。还介绍了各层开发规范，如ODS、DWD、DWS和ADS的命名和设计要点，旨在确保数仓的高效、标准化和一致性。

摘要由CSDN通过智能技术生成

目录

一、数据模型设计规范

1.1 数仓分层原则

1.2 主题域划分原则

1.3 数据模型设计原则

1.4 数据模型管理的目标

1.5 数仓建模的方法

1.5.1 维度建模

1.5.2 三范式建模

1.5.3 三范式与维度建模区别

二、数仓公共开发规范

2.1 层次调用规范

2.2 数据类型规范

2.3 数据冗余规范

2.4 空值处理原则

2.5 指标定义规范

三、数仓各层开发规范

3.1 ods层设计的规范

3.2 dim层设计的规范

3.3 dwd层设计的规范

3.4 dws层设计的规范

四、数仓各层命名规范

4.1 ODS层的命名规范

4.2 DIM层的命名规范

4.3 DWD层的命名规范

4.4 DWS层的命名规范

前言

主要包括数据模型设计规范、数仓公共开发规范、数仓各层开发规范、数仓命名规范。

一、数据模型设计规范

1.1 数仓分层原则

优秀的数仓体系需要清晰的数据分层结构，即要保证数据层的稳定又要屏蔽对下游的影响，并且要避免链路过长。数仓分层没有最好，只有最合适。一个好的分层架构，要有以下好处：

数据血缘追踪：

了解本专栏

超级会员免费看

关注

45
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

吵吵叭火 CSDN认证博客专家 CSDN认证企业博客

码龄6年

216: 原创

29万+: 周排名

8076: 总排名

34万+: 访问

: 等级

6835: 积分

3342: 粉丝

4455: 获赞

43: 评论

4290: 收藏

私信

关注

热门文章

分类专栏

最新评论

Doris存储层设计介绍1——存储结构设计解析（索引底层结构）
qq_34887341: 全篇page、index、page index 被你绕晕了
DolphinScheduler-3.2.0集群部署流程
CSDNnorookie: 相当有用我的就是没有加双引号失败了
HiveSQL实战——大厂面试真题
穷苦书生_万事愁: 阅读了博主关于"HiveSQL实战——大厂面试真题"的文章后，我对这个主题有了全新的认识。博主在文章中的细节描写非常到位，让我感受到了博主的深厚功底和实践经验。希望博主能够继续分享更多有价值的文章，同时也期待能够得到博主的指导和帮助，共同进步。非常感谢博主的分享和支持！
数据治理——数据血缘简介
sss punch: atlas对字段血缘关系的支持咋样，JanusGraph和 Solr需要用户自建吗？
Hive SQL ——窗口函数源码阅读
小王毕业啦: 博主的《Hive SQL ——窗口函数源码阅读》这篇文章真是让我受益匪浅。在阅读过程中，我发现博主对这个主题的深入了解和独到见解让我眼前一亮。文章中细致入微的描述和分析，让我对窗口函数有了全新的认识，让我意识到自己以前对这个主题的了解仅仅是皮毛而已。博主的文笔流畅，逻辑清晰，堪称深厚功底的典范。期待博主未来能够持续分享更多类似的好文，让我们能够在博主的指导下一同进步。再次感谢博主的无私分享和支持！

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。