实时数仓分层及每层职能

最新推荐文章于 2024-08-05 19:05:39 发布

大数据面壁者

最新推荐文章于 2024-08-05 19:05:39 发布

阅读量1.1k

点赞数 1

分类专栏：实时数仓文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42796403/article/details/114847758

版权

实时数仓专栏收录该内容

39 篇文章 12 订阅

订阅专栏

实时数仓分层

建设实时数仓的目的，主要是增加数据计算的复用性。每次新增加统计需求时，不至于从原始数据进行计算，而是从半成品继续加工而成。
在这里插入图片描述

每层职能

分层	数据描述	生成计算工具	存储媒介
ODS	原始数据，日志和业务数据	日志服务器，maxwell	kafka
DWD	根据数据对象为单位进行分流，比如订单、页面访问等等。	FLINK	kafka
DWM	对于部分数据对象进行进一步加工，比如独立访问、跳出行为。依旧是明细数据。	FLINK	kafka
DIM	维度数据	FLINK	HBase
DWS	根据某个维度主题将多个事实数据轻度聚合，形成主题宽表。	FLINK	Clickhouse
ADS	把Clickhouse中的数据根据可视化需要进行筛选聚合。	Clickhouse SQL	可视化展示

关于将维度表存储到hbase主要是因为kafka中的数据只能顺序读取，无法随机读取，而实时计算场景对数据的要求数据相应要快，而且一般是宽表，显然存储到kafka并不能满足实时计算后期的聚合需求。

大数据面壁者

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

大数据面壁者 CSDN认证博客专家 CSDN认证企业博客

码龄6年

327: 原创

17万+: 周排名

82万+: 总排名

42万+: 访问

: 等级

4852: 积分

269: 粉丝

175: 获赞

136: 评论

1272: 收藏

私信

关注

热门文章

分类专栏

最新评论

log4j升级之路
CSDN-Ada助手: 非常感谢CSDN博主<您的博主名>，这篇博客“log4j升级之路”让我受益匪浅。我觉得您可以继续写一篇关于日志框架的博客，比如“logback使用指南”或“slf4j实践总结”，这样的技术文章对其他用户也会非常有帮助。下一篇您可以就<您的博客主题建议>继续写，相信会有更多读者受益。期待您的下一篇好文！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
Flink流处理查询外部数据源的解决方法
Jiec_2018: 没demo吗？
使用FlinkSQL将数据写入到ClickHouse
chaojiyuhao: 大佬flinkjar下不了可以更新一下吗
使用FlinkSQL将数据写入到ClickHouse
TUBER727: 大佬，可以分一下驱动jar包吗
使用FlinkSQL将数据写入到ClickHouse
机佬快跑: 你的flink是什么版本

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。