ClickHouse JOIN优化技巧

最新推荐文章于 2023-06-04 11:16:22 发布

大数据盼盼

最新推荐文章于 2023-06-04 11:16:22 发布

阅读量731

点赞数 1

文章标签： clickhouse

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_66455465/article/details/130074223

版权

1.避免JOIN

数据预生成(由Spark/Flink或者Clickhouse物化视图产出数据)，形成大宽表，基于单表的查询是ClickHouse最为擅长的场景

2.使用IN代替JOIN

JOIN需要基于内存构建hash table且需要存储右表全部的数据，然后再去匹配左表的数据。而IN查询会对右表的全部数据构建hash set，但是不需要匹配左表的数据，且不需要回写数据到block

3.优先本地JOIN

数据预先相同规则分区，也就是Colocate JOIN。优先将需要关联的表按照相同的规则进行分布，查询时就不需要分布式的JOIN

4.数据冗余存储

如果一个表的数据量比较小，可以不分shard存储，每个shard都存储全量的数据，例如我们的业务对象表。查询时，不需要分布式JOIN，直接在本地进行JOIN即可，这样也可以避免分布式JOIN带来的查询放大和全表数据分发问题

5.更少的数据

不论是分布式JOIN还是本地JOIN，都需要尽量让少的数据参与JOIN，既能提升查询速度也能减少资源消耗

6.优化分布式JOIN的执行逻辑，依托于字节跳动对ClickHouse 的深度定制化

7.小表置于join右侧降低内存消耗

8.减少数据扫描提高执行速度通过增加过滤逻辑可以减少数据扫描，达到提高执行速度及降低内存消耗的目的。

大数据盼盼

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
ClickHouse JOIN优化技巧

如果一个表的数据量比较小，可以不分shard存储，每个shard都存储全量的数据，例如我们的业务对象表。查询时，不需要分布式JOIN，直接在本地进行JOIN即可，这样也可以避免分布式JOIN带来的查询放大和全表数据分发问题。而IN查询会对右表的全部数据构建hash set，但是不需要匹配左表的数据，且不需要回写数据到block。优先将需要关联的表按照相同的规则进行分布，查询时就不需要分布式的JOIN。不论是分布式JOIN还是本地JOIN，都需要尽量让少的数据参与JOIN，既能提升查询速度也能减少资源消耗。
复制链接

扫一扫

大数据盼盼 CSDN认证博客专家 CSDN认证企业博客

码龄2年

31: 原创

117万+: 周排名

6万+: 总排名

8169: 访问

: 等级

326: 积分

31: 粉丝

6: 获赞

2: 评论

9: 收藏

私信

关注

热门文章

分类专栏

SparkSql 1篇

最新评论

Hbase特点
CSDN-Ada助手: 很棒的博客，对Hbase的特点进行了简洁明了的介绍。希望你能够继续写出更多关于Hbase的优劣分析和使用技巧，让读者更好地了解和使用这个强大的数据库。另外，补充一下Hbase的数据模型和架构设计也是一个很好的扩展方向。加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434
Hbase的写逻辑
CSDN-Ada助手: 恭喜您写出了关于Hbase写逻辑的精彩博客！不仅内容深入浅出、逻辑清晰，而且对读者的帮助非常大。希望您继续保持创作的热情，为我们带来更多有价值的文章。接下来，建议您可以探讨一下Hbase在大数据场景下的应用案例或者是结合实际场景来分析一下Hbase的性能优化。期待您的下一篇博客！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148 看奖励名单。
Hbase 架构各个角色的功能以及使用场景
CSDN-Ada助手: 非常感谢用户的分享，这篇博客对于理解 Hbase 架构各个角色的功能以及使用场景非常有帮助。很高兴看到用户持续创作，希望能够继续分享更多关于 Hbase 的知识和经验，让更多人受益。建议下一步可以深入探讨 Hbase 的性能优化和实战经验，期待用户的精彩发表。 CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=ada，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。