Clickhouse 索引类型明细

最新推荐文章于 2024-03-12 17:26:21 发布

in_tsz

最新推荐文章于 2024-03-12 17:26:21 发布

阅读量693

点赞数 4

文章标签： clickhouse 数据库算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35667076/article/details/136336344

版权

索引类型	原理	适用场景	性能提升	局限性	每条索引大小	备注
主键索引	字段进行排序索引	经常用于点查的唯一主键如uuId	提升点查（logN）和该字段的排序性能	只有一个主键索引，多套主键的设置会消耗成倍的存储	主键表达式长度
min_max索引	记录每个数据块的最大最小值	适用于数据入库有序的字段保证各个part内的数据相对来说独立，交集较少，如数据时间字段	可用于过滤大量不相管的数据分区合理配置可几十上百倍提高性能	离散分布于所有数据中的字段不适用，如省份，年龄等	2 * 索引表达式长度
set	记录每个数据块内索引表达式的所有唯一取值	适用于每个数据块内基数较低但总体基数高的字段，在区间交集大的情况下作为 min_max 索引的补充	提升点查过滤性能	如果每个块包含大量惟一值，会造成性能低下，或者由于索引值个数超过max_size使索引在该块内失效。	N * 索引表达式长度 (N 为数据块内唯一值个数)
bloom_filter	基本的bloom filter实现	与 set 类似	-	函数支持少；只能进行值的完全匹配，不适用需要字符串分词的场景	bloom filter 数组大小
tokenbf_v1	将字符串分割成单词，并在bloom filter中记录该单词的存在性	适用于简单的文本搜索场景，在长字符串中搜索单词（或其它可分割的子字符串）。例如在应用程序的日志中使用 IN 操作符搜索几个类名或行号。	提升简单文本搜索场景下的子字符串匹配性能	不适用中文分词场景	bloom filter 数组大小
ngrambf_v1	功能与tokenbf_v1相同，但是文本分割方式不一样。该索引将字符串分割成多个ngram，并在 bloom filter 中记录该ngram的存在性	适用于简单的文本搜索场景，在长字符串中搜索子字符串。这个索引在对中文等没有单词分隔的语言中进行文本搜索的场景中比tokenbf_v1更有用。	提升简单文本搜索场景下的子字符串匹配性能	机制简单，不适用于大量文本搜索场景	bloom filter 数组大小
hypothesis	记录字段与字段之间、字段与值之间的比较关系	如果查询条件中常常出现列与列之间的比较关系，可以适用此索引	-	索引表达式只能是单个简单表达式，不能是复合表达式。	1 （单个布尔值）
inverted	这是一个实现全文检索的倒排索引	适用于在大量文本中进行关键字搜索的场景	可达到一至两个数量级的性能提升	inverted 索引以 index_granularity 为最小粒度，ClickHouse 还需要对的数据块执行实际扫描，而不是直接定位所有包含该字符串的行，所以 gin 的实际性能未达到极致	不确定	实验性特性

关注

4
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

in_tsz CSDN认证博客专家 CSDN认证企业博客

码龄8年

35: 原创

112万+: 周排名

7万+: 总排名

4万+: 访问

: 等级

1086: 积分

542: 粉丝

734: 获赞

11: 评论

379: 收藏

私信

关注

热门文章

最新评论

图计算浅谈：主流图存储引擎/图搜索算法
CSDN-Ada助手: 算法技能树或许可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
Spring AOP 面向切面编程通用化实现方案
普通网友: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Clickhouse & Elasticsearch 选型对比
CSDN-Ada助手: 恭喜您在博客中对Clickhouse & Elasticsearch进行了深入的选型对比，这对于我们选择合适的数据存储和搜索引擎工具有着重要的指导意义。希望您能继续保持创作的热情和耐心，不断分享您的见解和经验。或许下一步可以考虑深入研究它们在大规模数据处理和实时搜索方面的应用案例，这将为读者提供更多实用的参考价值。期待您更多精彩的博客文章！
Clickhouse: 随笔杂记
CSDN-Ada助手: 恭喜您写下了第18篇博客！能够坚持持续创作并分享自己的见解和经验真的很不容易，您的努力和执着让我深感钦佩。希望您可以继续保持这样的创作热情，不断探索新的主题和内容，也可以考虑增加一些实际案例或者个人的心得体会，让读者更加有身临其境的感受。期待您未来更加精彩的创作！
Clickhouse: 数据基本知识
CSDN-Ada助手: 恭喜您写了第17篇博客，标题为“Clickhouse: 数据基本知识”。您对Clickhouse数据基本知识的深入探讨让我受益匪浅。希望您能继续坚持创作，分享更多关于数据处理方面的知识和经验。下一步，我建议您可以考虑深入研究Clickhouse的高级应用或者与其他数据处理工具的对比分析，这样可以为读者提供更全面的视角。期待您的下一篇文章！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。