ClickHouse 数据存储形式及索引原理

wangfy_

已于 2022-10-09 17:14:15 修改

阅读量715

点赞数

分类专栏：数据库文章标签： clickhouse

于 2022-10-08 19:45:23 首次发布

原文链接：https://juejin.cn/post/6863283398727860238

版权

数据库专栏收录该内容

86 篇文章 0 订阅

订阅专栏

1、列式数据库，对比于行式数据库mysql

查询提升200倍，ClickHouse你值得拥有！ - 掘金

2、索引原理，稀疏索引，及查询流程

ClickHouse的索引原理 - 掘金

3、索引原理

【ClickHouse内核】MergeTree索引相关基础知识点_Night_ZW的博客-CSDN博客

4、补充：一级索引

其实 clickhouse 的一级索引非常简单，只需要记录每一个 block 第一个值即可。例如一组一亿行的数据，主键范围从 1～100,000,000。存储到 clickhouse 后按照 8192 行为一个 block，那么一共有 12208 个 block。索引为 1，8193，16635…… 在查询时只需要就可以根据值确定到需要读取哪几个 block 了。例如我需要查询 id>500 and id <12258 的数据，那就只需要读取第 0 块和第 1 块 block 即可。在 clickhouse 的数据存储文件中，一级索引存在于 primary.idx 中。一级索引的本质是存储了每个 block 中数据的最小值，从而为确定需要查询的数据确定好其所在的 block。它简历了数据到 block 的映射关系。简单来说，给定一个数据，通过一级索引能够快速查询到这个数据所在的 block。从而避免查询一个数据需要遍历整个数据集。（转自 Clickhouse 系列 - 第四章 - 索引 - AddisonChen的个人空间 - OSCHINA - 中文开源技术交流社区）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

wangfy_ CSDN认证博客专家 CSDN认证企业博客

码龄9年

496: 原创

3万+: 周排名

2万+: 总排名

104万+: 访问

: 等级

1万+: 积分

139: 粉丝

315: 获赞

81: 评论

1039: 收藏

私信

关注

热门文章

分类专栏

最新评论

#### LRU算法 ####
wangfy_: https://leetcode.cn/problems/lru-cache/solution/lruhuan-cun-ji-zhi-by-leetcode-solution/
#### redis 事务/lua脚本/pipeline ####
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。
#### redis 事务/lua脚本/pipeline ####
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。
#### 同/异步IO（阻塞/非阻塞/多路复用select|poll|epol）及 GO中实现的“异步“IO方案 ####
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性。
#### 同/异步IO（阻塞/非阻塞/多路复用select|poll|epol）及 GO中实现的“异步“IO方案 ####
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。