（04）表引擎

最新推荐文章于 2024-03-12 17:26:21 发布

大数据开发工程师-宋权

最新推荐文章于 2024-03-12 17:26:21 发布

阅读量286

点赞数

分类专栏： ClickHouse 文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/song_quan_/article/details/119247353

版权

ClickHouse 专栏收录该内容

9 篇文章 2 订阅

订阅专栏

4.1 表引擎的使用

表引擎是 ClickHouse 的一大特色。可以说，

表引擎决定了如何存储标的数据。包括：

➢

数据的存储方式和位置，写到哪里以及从哪里读取数据

➢

支持哪些查询以及如何支持。

➢

并发数据访问。

➢

索引的使用（如果存在）。

➢

是否可以执行多线程请求。

➢

数据复制参数。

表引擎的使用方式就是必须显式在创建表时定义该表使用的引擎，以及引擎使用的相关参数。

特别注意：引擎的名称大小写敏感

4.2 TinyLog

以列文件的形式保存在磁盘上，不支持索引，没有并发控制。一般保存少量数据的小表，

生产环境上作用有限。可以用于平时练习测试用。

如：

create table t_tinylog ( id String, name String) engine=TinyLog ;

4.3 Memory

内存引擎，数据以未压缩的原始形式直接保存在内存当中，服务器重启数据就会消失。

读写操作不会相互阻塞，不支持索引。简单查询下有非常非常高的性能表现（超过 10G/s）。

一般用到它的地方不多，除了用来测试，就是在需要非常高的性能，同时数据量又不太

大（上限大概 1 亿行）的场景。

4.4 MergeTree

ClickHouse 中最强大的表引擎当属 MergeTree（合并树）引擎及该系列（*MergeTree）

中的其他引擎，支持索引和分区，地位可以相当于 innodb 之于 Mysql。而且基于

MergeTree，还衍生除了很多小弟，也是非常有特色的引擎。

➢ 建表语句

➢ 插入数据

MergeTree 其实还有很多参数(绝大多数用默认值即可)，但是三个参数是更加重要的，

也涉及了关于 MergeTree 的很多概念。

4.4.1 partition by 分区（可选项）

➢

作用

学过 hive 的应该都不陌生，分区的目的主要是降低扫描的范围，优化查询速度

➢

如果不填

只会使用一个分区。

➢

分区目录

MergeTree 是以列文件+索引文件+表定义文件组成的，但是如果设定了分区那么这

些文件就会保存到不同的分区目录中。

➢

并行

分区后，面对涉及跨分区的查询统计，ClickHouse 会以分区为单位并行处理。

➢

数据写入与分区合并

任何一个批次的数据写入都会产生一个临时分区，不会纳入任何一个已有的分区。写入

后的某个时刻（大概 10-15 分钟后），ClickHouse 会自动执行合并操作（等不及也可

以手动通过 optimize 执行），把临时分区的数据，合并到已有分区中。

optimize table xxxx final;

➢

例如

再次执行上面的插入操作

查看数据并没有纳入任何分区

手动 optimize 之后

hadoop202 :) optimize table t_order_mt final;

再次查询

大数据开发工程师-宋权

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
（04）表引擎

4.1 表引擎的使用表引擎是 ClickHouse 的一大特色。可以说，表引擎决定了如何存储标的数据。包括： ➢ 数据的存储方式和位置，写到哪里以及从哪里读取数据 ➢ 支持哪些查询以及如何支持。 ➢ 并发数据访问。 ➢ 索引的使用（如果存在）。 ➢ 是否可以执行多线程请求。 ➢ 数据复制参数。表引擎的使用方式就是必须显式在创建表时定义该表使用的引擎，以及引擎使用的相关参数。特别注意：引擎的名称大小写敏感4.2 TinyLog
复制链接

扫一扫

专栏目录

大数据开发工程师-宋权 CSDN认证博客专家 CSDN认证企业博客

码龄9年

309: 原创

5万+: 周排名

44万+: 总排名

27万+: 访问

: 等级

3608: 积分

205: 粉丝

99: 获赞

68: 评论

525: 收藏

私信

关注

热门文章

分类专栏

最新评论

Flink CDC数据同步
m0_61571350: 用流过去到了，可以直接计算吗？如果监控到更新或者删除的，要单独处理吗？直接会不会影响指标
FineBI产品简介
永久青铜: 我怎么没有你这个仪表板的样式
FineBI概述
Devil I'm: HAHA CIO
Sql Server CDC配置
爱吃冰的猫: 难道我有20个cdc表发生变动后只能逐个重新开启？这显然不符合实际使用啊
使用Flume消费Kafka数据到HDFS (亲测好用)
天地风雷水火山泽: 按照博客的启动命名执行后，这个flume停不下来，会自行启动？一旦ctrl+C退出后，它不久就会自行启动，这个怎么关闭？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

大数据开发工程师-宋权 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。