Clickhouse使用经验之谈（持续更新）

zcx_bigdata

于 2021-08-26 11:49:23 发布

阅读量921

点赞数 3

分类专栏： clickhouse使用经验 clickhouse clickhouse坑文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011611051/article/details/119927759

版权

clickhouse 同时被 3 个专栏收录

5 篇文章 0 订阅

订阅专栏

clickhouse使用经验

2 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

1.OLAP工具。

2.适合大宽表，读大量行但是少量列，结果集小。

3.不更新或少更新(延迟高、代价大)。

可以考虑用insert替代update，用VersionedCollapsingMergeTree。

4.避免热点、数据倾斜，对写入数据预处理，将数据均匀分散到各shard的各块盘。

5.集群限流方案：

并发高导致集群瘫痪
大查询导致集群瘫痪（包括：查询请求不合理导致集群负载过高，扫描数据量过大，join使用不规范等）

避免对集群安全性造成影响，需要提前做预判。

6.集群统一调度方案：队列有优先级控制，ad-hoc查询优先级高，同步查询，大部分查询对于使用者来说感觉不到异步。

7.对于数据量大，任务重的需求，尽可能提升硬盘IO（包括增加块数以及单盘read性能）、CPU（增加core数量）、内存。

8.根据字段的数量、字段的大小、查询任务的复杂度以及业务要求的时效性去评估单shard单盘的数据量。

9.热点数据单独部署集群，避免多个业务需求互相影响。

10.尽量少做大查询任务，避免对其他同步任务的时效性造成影响。当同时做多个大查询任务，并发会很低，前面任务占用机器硬件资源导致后来任务长时间处于等待状态。

11.大查询、小查询的任务不建议在同一个集群，大查询会严重拖慢小查询的任务，对小查询的时效性有很大的影响，建议分开部署到不同的集群上

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
Clickhouse使用经验之谈（持续更新）

1.OLAP工具。2.适合大宽表，读大量行但是少量列，结果集小。3.不更新或少更新(延迟高、代价大)。4.避免热点、数据倾斜，对写入数据预处理，将数据均匀分散到各shard的各块盘。5.集群限流方案：并发高导致集群瘫痪大查询导致集群瘫痪（包括：查询请求不合理导致集群负载过高，扫描数据量过大，join使用不规范等）避免对集群安全性造成影响，需要提前做预判。6.集群统一调度方案：队列有优先级控制，ad-hoc查询优先级高，同步查询，大部分查询对于使用者来说感觉不到异步。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

zcx_bigdata 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。