clickhouse语句_ClickHouse及其MergeTree引擎

最新推荐文章于 2024-07-06 21:00:08 发布

闪电姐姐的龙猫阿呆

最新推荐文章于 2024-07-06 21:00:08 发布

阅读量622

点赞数

文章标签： clickhouse语句

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_29104059/article/details/112842934

版权

本文介绍了ClickHouse的MergeTree引擎，它是ClickHouse用于OLAP场景的主要表引擎，支持主键索引、数据分区和高吞吐量查询。MergeTree的特性包括列式存储、数据分区、一级索引和数据合并。文章详细讲解了如何创建MergeTree表，包括ORDER BY、PARTITION BY等参数，并探讨了其存储结构和数据处理逻辑。此外，还提到了其他MergeTree系列引擎，如ReplacingMergeTree、SummingMergeTree、AggregatingMergeTree和CollapsingMergeTree，以及它们在数据去重、聚合和删除方面的处理方式。

摘要由CSDN通过智能技术生成

ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。

OLAP场景的关键特征

OLAP(OnLine Analysis Processing ，联机分析处理),核心思想就是建立多维度的数据立方体，以维度(Dimension)和度量(Measure)为基本概念，辅以元数据，实现可以钻取、切片、切块、旋转等灵活、系统、直观的数据展现。

它的特征有：绝大多数是读请求 -数据以相当大的批次(> 1000行)更新，而不是单行更新;或者根本没有更新。

已添加到数据库的数据不能修改。

对于读取，从数据库中提取相当多的行，但只提取列的一小部分。

宽表，即每个表包含着大量的列

查询相对较少(通常每台服务器每秒查询数百次或更少)

对于简单查询，允许延迟大约50毫秒

列中的数据相对较小：数字和短字符串(例如，每个URL 60个字节)

处理单个查询时需要高吞吐量(每台服务器每秒可达数十亿行)

事务不是必须的

对数据一致性要求低

每个查询有一个大表。除了他以外，其他的都很小。

查询结果明显小于源数据。换句话说，数据经过过滤或聚合，因此结果适合于单个服务器的RAM中

ClickHouse不适用的场景不支持事务

不擅长按照主键进行粒度的查询(虽然支持)

不擅长按行删除数据(虽然支持)

ClickHouse的MergeTree引擎

MergeTree是ClickHouse最常用的表引擎，支持主键索引，数据分区，数据副本和数据采样等功能。

MergeTree的创建方式和存储方式

MergeTree写入一批数据时，数据会以数据片段的的形式写入磁盘，并且数据片段不可修改。为了逼迫数据片段过多，ClickHouse会通过后台线程，定期合并这些数据片段。

MergeTree的创建方式

CREATE TABLE [IF NOT EXISTS] [db_name].table_name (

)ENGINE = MergeTree()

[PARTITION BY expr]

[ORDER BY expr]

[PRIMARY KEY expr]

[SAMPLE BY expr]

[SETTINGS name=value,...]

(1)PARTITION BY[选填]: 分区键，用于指定表数据以何种形式进行分区。分区键支持：单个列字段，元组的形式使用多个列字段，列表达式。不声明的话，ClickHouse会生成一个all的分区。

(2)ORDER BY[必填]: 排序键，指定在一个数据片段内，数据以何种标准排序。默认情况下主键和排序键相同。

(3)PRIMARY KEY[选填]: 主键，主键字段生成一级索引，用于加上表查询。MergeTree运行重复数据(Re

最低0.47元/天解锁文章

闪电姐姐的龙猫阿呆

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。