StarRocks实战——多点大数据数仓构建

吵吵叭火

已于 2024-04-17 10:48:36 修改

阅读量2.3k

收藏 23

点赞数 18

分类专栏：大数据文章标签：数据仓库大数据

于 2024-03-28 21:56:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SHWAITME/article/details/137125703

版权

大数据专栏收录该内容

55 篇文章 1 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

目录

前言

一、背景介绍

二、原有架构的痛点

2.1 技术成本

2.2 开发成本

2.2.1 离线 T+1 更新的分析场景

2.2.2 实时更新分析场景

2.2.3 固定维度分析场景

2.2.4 运维成本

三、选择StarRocks的原因

3.1 引擎收敛

3.2 “大宽表”模型替换

3.3 简化Lambda架构

3.4 模型持续迭代

3.5 明细、汇总一体化

3.6 外表能力

3.7 单表聚合查询

3.8 多表关联查询

3.9 实时更新读写查询

四、实践经验

4.1 集群拆分

4.2 按照数据更新频率进行拆分

4.3 按照业务域进行拆分

4.4 调优手段

4.4.1 优化表结构定义

1）模型选择

2）分区和分桶

3）稀疏索引、bloomfilter、Bitmap Index

4）物化视图

5）使用BITMAP / HyperLogLog 数据类型进行去重

4.4.2 优化查询SQL

1）Broadcast Join

2）Colocation Join

3）并行度调整

4）CBO 优化器

4.5 工具集成

4.5.1 数据集成

4.5.2 监控预警

五、总结

原文大佬介绍的这篇StarRocks数仓建设实践有借鉴意义的，这些摘抄下来用作沉淀学习。如有侵权，请告知~

前言

多点 DMALL 成立于2015年，是一站式全渠道数字零售解决方案服务商。多点大数据部门使用 StarRocks逐步替代了 Impala、Impala on Kudu、Apache Kylin等存储引擎，实现了存储引擎的收敛，简化了实时数据处理链路，同时也能保障较高的查询并发以及较低的响应延迟要求。

一、背景介绍

多点大数据部门为内部业务研发团队、数据分析师、外部用户以及合作伙伴，提供了基础的大数据产品、平台服务，帮助零售企业解决了从基本的数据汇总管理、统一的数据计算应用、到各种场景下对数据的多模式使用的需求，可覆盖零售企业绝大部分数据诉求。

了解本专栏

超级会员免费看

吵吵叭火

关注

18
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

吵吵叭火

博客等级

码龄6年

216
原创

4453
点赞

4275
收藏

3323
粉丝

关注

私信

热门文章

分类专栏

最新评论

DolphinScheduler-3.2.0集群部署流程
CSDNnorookie: 相当有用我的就是没有加双引号失败了
HiveSQL实战——大厂面试真题
穷苦书生_万事愁: 阅读了博主关于"HiveSQL实战——大厂面试真题"的文章后，我对这个主题有了全新的认识。博主在文章中的细节描写非常到位，让我感受到了博主的深厚功底和实践经验。希望博主能够继续分享更多有价值的文章，同时也期待能够得到博主的指导和帮助，共同进步。非常感谢博主的分享和支持！
数据治理——数据血缘简介
sss punch: atlas对字段血缘关系的支持咋样，JanusGraph和 Solr需要用户自建吗？
Hive SQL ——窗口函数源码阅读
小王毕业啦: 博主的《Hive SQL ——窗口函数源码阅读》这篇文章真是让我受益匪浅。在阅读过程中，我发现博主对这个主题的深入了解和独到见解让我眼前一亮。文章中细致入微的描述和分析，让我对窗口函数有了全新的认识，让我意识到自己以前对这个主题的了解仅仅是皮毛而已。博主的文笔流畅，逻辑清晰，堪称深厚功底的典范。期待博主未来能够持续分享更多类似的好文，让我们能够在博主的指导下一同进步。再次感谢博主的无私分享和支持！
第6.5章：Doris查询加速——Join优化原理
吵吵叭火: N个partition，每个partition共有M个bucket，我当然知道分区跟分片是一对多的关系。。。图中的箭头是简略的。。。质疑别人之前，麻烦自己好好论证下。。

最新文章

2024

08月 14篇

07月 15篇

06月 5篇

05月 3篇

04月 20篇

03月 46篇

02月 95篇

01月 18篇

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值