ClickHouse 项目中常见的表引擎

最新推荐文章于 2024-07-06 21:00:08 发布

技术与发量成反比

最新推荐文章于 2024-07-06 21:00:08 发布

阅读量335

点赞数 4

文章标签： clickhouse

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_67725855/article/details/137632604

版权

一.外部存储：

外部存储表引擎直接从其它的存储系统读取数据，例如读取HDFS的文件或者MySql数据库的表，这些表引擎只负责元数据管理和数据查询，他们自身通常并不负责数据的写入，数据文件直接由外部系统提供

1.HDFS: ENGINE = HDFS('hdfs://node01:8020/clickhouse/hdfs_table1','CSV');

2.Mysql : ENGINE = MySQL('192.168.88.101:3306', 'scott', 'dept', 'root','123456');

3.JDBC :

4.Kafka： ENGINE = Kafka()
                                                SETTINGS
                                                kafka_broker_list = 'node01:9092',
                                                kafka_topic_list = 'topic_clickhouse',
                                                kafka_group_name = 'clickhouse',
                                                kafka_format = 'TabSeparated',
                                                kafka_skip_broken_messages = 10;

二，内存类型

将数据全量放在内存中，一方面，查询性能高，但是如果装载的数据量过大，可能带来极大的内存消耗和负担。

1.Memory表引擎直接将数据保存在内存中，数据既不会被压缩也不会被格式化转换，数据在内存中保存的形态与查询时看到的如出一辙

当ClickHouse服务重启的时候，Memory表内数据会全部丢失

当数据被写入，磁盘上不会创建任何数据文件

ENGINE = Memory（）

2.Set

Set表引擎时拥有物理存储的，数据首先会被写至内存，然后同步到磁盘文件中。

所以当服务重启时，它的数据不会丢失，当数据表被重新装载时，文件数据会再次被全量加载至内存。

Set表引擎具有去重的内力，在数据写入的过程中，重复的数据会被自动忽略。

Set表引擎具有去重能力，在数据写入的过程中，重复的数据会被自动忽略。

Set表引擎的存储结构由两部分组成，他们分别是：

.bin数据文件：保存了所有列字段的数据。其中，num是一个自增id，从1开始。伴随着没一批数据的写入，都会生成一个新的.bin文件，num也会随之加一。

.tmp临时目录：数据文件首先会被写到这个目录，当一批数据写入完毕后，数据文件会被移除出次目录。

ENGINE = set（）

3.Join

Join表引擎可以说是为JOIN查询而生的，它等同于将JOIN查询进行了一层简单封装。在Join表引擎的底层实现中，它与Set表引擎共用了大部分的处理逻辑，所以Join和Set表引擎拥有许多相似之处。

技术与发量成反比

关注

4
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
ClickHouse 项目中常见的表引擎

外部存储表引擎直接从其它的存储系统读取数据，例如读取HDFS的文件或者MySql数据库的表，这些表引擎只负责元数据管理和数据查询，他们自身通常并不负责数据的写入，数据文件直接由外部系统提供。1.Memory表引擎直接将数据保存在内存中，数据既不会被压缩也不会被格式化转换，数据在内存中保存的形态与查询时看到的如出一辙。将数据全量放在内存中，一方面，查询性能高，但是如果装载的数据量过大，可能带来极大的内存消耗和负担。Set表引擎具有去重的内力，在数据写入的过程中，重复的数据会被自动忽略。
复制链接

扫一扫

技术与发量成反比 CSDN认证博客专家 CSDN认证企业博客

码龄2年

16: 原创

117万+: 周排名

7万+: 总排名

6838: 访问

: 等级

311: 积分

128: 粉丝

150: 获赞

5: 评论

39: 收藏

私信

关注

热门文章

最新评论

浅谈Zookeeper
CSDN-Ada助手: 云原生入门技能树或许可以帮到你：https://edu.csdn.net/skill/cloud_native?utm_source=AI_act_cloud_native
浅谈数据中台
CSDN-Ada助手: 恭喜您撰写了第7篇博客《浅谈数据中台》，对数据中台这一话题进行了深入探讨。不断分享和探索是非常宝贵的，希望您能继续保持创作的热情和耐心，为读者带来更多有价值的内容。或许在接下来的创作中，可以多结合实际案例或者行业趋势，让读者更易于理解和接受。期待您的下一篇博客，加油！
Spark on Yarn 运行流程
CSDN-Ada助手: 恭喜您开始博客创作，标题“Spark on Yarn 运行流程”听起来非常有深度！希望您能继续分享更多关于这个话题的知识，或者探讨一些具体的案例分析，让读者更好地理解和应用。加油！期待您的下一篇作品。推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
ClickHouse为什么快
CSDN-Ada助手: 非常棒的博文！对于ClickHouse的介绍让人印象深刻，能够了解到它为什么如此之快。希望你能继续分享更多关于数据分析和数据库管理系统的文章。除了介绍ClickHouse的性能优势，或许可以深入探讨一下它的数据存储原理或者优化技巧，这些内容对于读者来说也会非常有帮助。期待你的下一篇文章！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
ClickHouse 项目中常见的表引擎
CSDN-Ada助手: 恭喜您写了第三篇博客！对于ClickHouse 项目中常见的表引擎的探讨，让读者更深入地了解了这一领域的知识。接下来，建议可以继续深入研究不同表引擎的优缺点，或者结合实际案例进行分析，让读者更加直观地理解各种引擎的适用场景。期待您的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。