数仓建模—实时数仓架构发展史

最新推荐文章于 2024-10-05 12:07:17 发布

不二人生

最新推荐文章于 2024-10-05 12:07:17 发布

阅读量6.9w

点赞数 2

分类专栏：数仓建模文章标签：数据仓库数仓建模实时数仓

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/king14bhhb/article/details/121330791

版权

数仓建模专栏收录该内容

90 篇文章 162 订阅 ¥119.90 ¥299.90

订阅专栏

超级会员免费看

本文讲述了实时数仓架构的发展历程，从1.0时代的Kafka+Flink基础架构，解决实时报表需求，到2.0时代的批流一体和数据湖技术（如Delta, Hudi, Iceberg），统一存储解决数据存储和查询问题，再到3.0时代的计算引擎统一，如Spark或Flink与数据湖结合，实现SQL和计算的统一。实时数仓的演进旨在提高数据处理效率和实时性，同时降低维护成本。" 105893653,7825138,深度强化学习DRL实战：倒立摆与自定义组件,"['深度学习', '强化学习', '机器学习', 'TensorFlow']

摘要由CSDN通过智能技术生成

实时数仓架构发展史

当前基于Hive的离线数据仓库已经非常成熟，数据中台体系也基本上是围绕离线数仓进行建设。

但是随着实时计算引擎的不断发展以及业务对于实时报表的产出需求不断膨胀，业界最近几年就一直聚焦并探索于两个相关的热点问题：实时数仓建设和大数据架构的批流一体建设。

实时数仓1.0

传统意义上我们通常将数据处理分为离线数据处理和实时数据处理。

对于实时处理场景，我们一般又可以分为两类，一类诸如监控报警类、大屏展示类场景要求秒级甚至毫秒级；另一类诸如大部分实时报表的需求通常没有非常高的时效性要求，一般分钟级别，比如10分钟甚至30分钟以内都可以接受。

对于第一类实时数据场景来说，业界通常的做法比较简单粗暴，一般也不需要非常仔细地进行数据分层，数据直接通过Flink计算或者聚合之后将结果写入MySQL/ES/HBASE/Druid/Kudu等，直接提供应用查询或者多维分析。如下所示：

而对于后者来说，通常做法会按照数仓结构进行设计，我们称后者这种应用场景为实时数仓，将作为本篇文章讨论的重点。

了解本专栏

超级会员免费看

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

不二人生

CSDN认证博客专家 CSDN认证企业博客

码龄8年

第四届全国大学生数据挖掘技术比赛获奖者

668: 原创

1万+: 周排名

2431: 总排名

2982万+: 访问

: 等级

1万+: 积分

2579: 粉丝

2257: 获赞

382: 评论

2874: 收藏

私信

关注

热门文章

分类专栏

最新评论

数仓建模—事实表
红魔(^ω^): 在本篇文章中，把订单表约等于销售表，当成事实表来建模；在下一篇文章的【唯度整合拆分】部分中，https://blog.csdn.net/king14bhhb/article/details/120665525 又提到了单独的订单维度表。因此，我能不能这样理解，维度表和事实表之间并没有完全严格的界限：如果我们不关注实体描述性的字段，则可以退化维度，将订单的描述信息放到销售、退货等事实表中冗余存储；如果我们需要额外关注订单描述信息，并且不想要在多个事实表中冗余这些字段，则可以单独抽一个维度表。
数仓建模—事实表
红魔(^ω^): 升级销售事实表貌似增加了很多一些和销售这一动作无关的字段。比如说交付、付款.. 因此， 1、能否将这些和销售动作无关的字段拆分到单独的事实表中。比如说付款表、交付表.. 2、付款表、交付表、销售表其中都关联了订单信息；能否将订单的描述性信息抽成一个维度表（如产品明细、销售员信息、用户信息、要求交期... ），销售表、付款表、交付表等事实表都通过订单号关联到订单维度表呢？
数仓工具—Hive语法之窗口函数first_value和last_value(12)
CSDN-Ada助手: Hive 是否支持外部表联接？
Spark MLlib模型训练—回归算法 Survival Regression
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，期待博主持续带来更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
ollama 本地部署大模型
averycoolboy: web交互部分如果不想装docker可以直接运行下面两个命令： python -m pip install ollama_gui python -m ollama_gui 就可以有简单的图像界面了

大家在看

最新文章

2024

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

不二人生 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。