clickHouse SQL调优

大师兄师傅

于 2024-02-20 17:41:56 发布

阅读量844

点赞数 22

分类专栏： clickHouse 文章标签： clickhouse sql 数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_23827347/article/details/136195396

版权

clickHouse 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1、合理使用数据表的分区字段和索引字段

MergeTree引擎会根据索引字段进行数据排序，并且根据index_granularity的配置生成稀疏索引。根据索引字段查询，能快速过滤数据，减少数据的读取，大大提升查询性能。

2、不要用select *，只查询需要的字段，减少机器负载，提升查询性能

3、通过limit限制查询返回的数据量

4、join查询时小表在右

大表join小表的性能比小表join大表的性能有数量级的提升。

5、ClickHouse不支持limit下推，sql生成时需要优化，以免sql性能受影响。【错误示例】 select did from (select did from tableA) limit 10; 【正确示例】 select did from (select did from tableA limit 10)

6、ClickHouse分布式join的性能较差，建议在模型侧将数据聚合成大宽表再导入 ClickHouse。尽量不要大表join 大表

实际建议：

1、明确数据查询的范围，增加条件过滤和查询的数据周期过滤，缩小数据查询范围。

2、在分组、join等操前做数据过滤，减少计算的数据量

3、用PREWHERE替代WHERE，优先过滤数据，加速查询。

4、对于字符串类型的字段做复杂计算，建议先编码成整数类型，以提升计算性能。

5、使用物化视图加速查询

6、ReplacingMergeTree表引擎数据查询，需要先做数据去重合并提升性能

如果使用去重引擎进行数据查询，且使用argMax函数和final关键字，会导致整个查询性能较差，需要提前对重复数据做合并去重optimize操作，查询时候直接查询不需要使用argMax函数和final关键字，提升查询性能。

大师兄师傅

关注

22
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
clickHouse SQL调优

如果使用去重引擎进行数据查询，且使用argMax函数和final关键字，会导致整个查询性能较差，需要提前对重复数据做合并去重optimize操作，查询时候直接查询不需要使用argMax函数和final关键字，提升查询性能。MergeTree引擎会根据索引字段进行数据排序，并且根据index_granularity的配置生成稀疏索引。根据索引字段查询，能快速过滤数据，减少数据的读取，大大提升查询性能。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。