Clickhouse引擎二: MergeTree 家族引擎
MergeTree 系列的表引擎是 ClickHouse 数据存储功能的核心。它们提供了用于弹性和高性能数据
检索的大多数功能:列存储,自定义分区,稀疏的主索引,辅助数据跳过索引等。 基本 MergeTree 表引擎可以被认为是单节点 ClickHouse 实例的默认表引擎,因为它在各种用例中通用 且实用。
除了基础表引擎 MergeTree 之 外,常用的表引擎还有 ReplacingMergeTree、SummingMergeTree、
AggregatingMergeTree、CollapsingMergeTree 和 VersionedCollapsingMergeTree。每一种合并树的 变种,在继承了基 础 MergeTree 的能力之后,又增加了独有的特性。其名称中的“合并” 二字奠定 了所有类型 MergeTree 的基因,它们的所有特殊逻辑,都是在 触发合并的过程中被激活的。
对于生产用途,ReplicatedMergeTree 是必经之路,因为它为常规 MergeTree 引擎的所有功能增加了高
可用性。一个额外的好处是在数据提取时自动进行重复数据删除,因此如果插入过程中出现网络问题, 该软件可以安全地重试。
该 MergeTree 系列(*MergeTree)的引擎和其他引擎是最强大的 ClickHouse 表引擎。 该 MergeTree
系列中的引擎旨在将大量数据插入表中。数据快速地逐个部分地写入表中,然后应用规 则在后台合并这些部分。这种方法比插入期间连续重写存储中的数据效率更高。
主要特点:
存储按主键排序的数据。 这使您可以创建一个小的稀疏索引,以帮助更快地查找数据。
如果指定了分区键,则可以使用分区。ClickHouse 支持的某些分区操作比对相同数据,相同结果的常规操作更有效。ClickHouse 还会自动切 断在查询中指定了分区键的分区数据。这也提高了查询性能。
数据复制支持。 ReplicatedMergeTree 表族提供数据复制。有关更多信息.
数据采样支持。 如有必要,可以在表中设置数据采样方法。
Merge Tree 引擎
MergeTree 在写入一批数据时,数据总会以数据片段的形式写入磁 盘,且数据片段不可修改。为了避