clickhouse分区目录的合并过程原理

最新推荐文章于 2024-05-27 17:21:20 发布

大数据架构师Pony

最新推荐文章于 2024-05-27 17:21:20 发布

阅读量3.1k

点赞数

分类专栏：大数据之Clickhouse 文章标签： clickhouse

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011110301/article/details/116600323

版权

大数据之Clickhouse 专栏收录该内容

34 篇文章 6 订阅

订阅专栏

目录

分区目录的合并过程

分区目录从创建、合并、到删除的整个过程

分区目录的合并过程

MergeTree的分区目录和传统意义上其他数据库有所不同。首先, MergeTree的分区目

录并不是在数据表被创建之后就存在的,而是在数据写入过程中被创建的。也就是说如果

一张数据表没有任何数据,那么也不会有任何分区目录存在。其次,它的分区目录在建立

之后也并不是一成不变的。在其他某些数据库的设计中,追加数据后目录自身不会发生变

化,只是在相同分区目录中追加新的数据文件。而 MergeTree完全不同,伴随着每一批数

据的写入(一次INSERT语句), MergeTree都会生成一批新的分区目录。即便不同批次写

入的数据属于相同分区,也会生成不同的分区目录。也就是说,对于同一个分区而言,也

会存在多个分区目录的情况。在之后的某个时刻(写入后的10~15分钟,也可以手动执行

optimize查询语句), ClickHouse会通过后台任务再将属于相同分区的多个目录合并成一个

新的目录。已经存在的旧分区目录并不会立即被删除,而是在之后的某个时刻通过后台任

务被删除(默认8分钟)。

属于同一个分区的多个目录,在合并之后会生成一个全新的目录,目录中的索引和数

据文件也会相应地进行合并。新目录名称的合并方式遵循以下规则,其中:

口 MinBlockNum:取同一分区内所有目录中最小的 MinBlockNum值。

口 MaxBlockNum:取同一分区内所有目录中最大的 MaxBlockNum值

口 Level:取同一分区内最大 Level值并加1

合并目录名称的变化过程如下图：

分区目录从创建、合并、到删除的整个过程

大数据架构师Pony

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
8
评论
clickhouse分区目录的合并过程原理

分区目录的合并过程MergeTree的分区目录和传统意义上其他数据库有所不同。首先, MergeTree的分区目录并不是在数据表被创建之后就存在的,而是在数据写入过程中被创建的。也就是说如果一张数据表没有任何数据,那么也不会有任何分区目录存在。其次,它的分区目录在建立之后也并不是一成不变的。在其他某些数据库的设计中,追加数据后目录自身不会发生变化,只是在相同分区目录中追加新的数据文件。而 MergeTree完全不同,伴随着每一批数据的写入(一次INSERT语句), MergeTree
复制链接

扫一扫

专栏目录

评论 8

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

大数据架构师Pony 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。