探究 | ES倒排索引和分词

兄弟萌,相信大家在学习 Elasticsearch 都听说过倒排索引吧,下面我们尝试用最简单易懂的方式来讲讲 ES 中的倒排索引和分词。

倒排索引建立的是单词和文档 id 的关联关系,建立倒排索引时,首先从文档中拆分出词条,这个过程就是 “分词”。

1.倒排索引

1.1 什么是倒排索引?

我们要搞懂倒排索引,首先来看看什么是正排(正向)索引
在这里插入图片描述
我们知道通过文章 id 可以快速查找到文章内容,之所以检索比较快是因为文章 id 设置为主键,同时生成了主键索引,然后通过主键索引快速关联到存储信息,这种索引就称为 “正排索引”。

欸,看似正排索引能够实现快速检索数据的要求,那为什么需要倒排索引呢?

如果我们想查询文章中包含哪些热门词汇,这时候比较麻烦,我们要做模糊查询,每条数据都要去遍历,因此性能差,而且查找内容的大小写、时态等都会影响查找准确率。

OK,进入正题,看看什么是倒排索引!

我们要换种方式将索引和数据关联,这就需要用到 “倒排索引”。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值