（二）elasticSearch之倒排索引

最新推荐文章于 2024-04-08 15:47:39 发布

方方土^_^

最新推荐文章于 2024-04-08 15:47:39 发布

阅读量703

点赞数 1

文章标签：索引搜索引擎 es elasticsearch java

本文链接：https://blog.csdn.net/weixin_44792186/article/details/121449555

版权

一、倒排索引

一、倒排索引

1、什么是正向索引：

我们在使用数据库搜索数据的时候，一般使用的就是正向索引。数据库一般会根据主键id创建索引，形成一颗b+树，根据主键搜索的时候会非常快。这种就是正向索引。
请添加图片描述但是如果根据title来模糊搜索数据，这个时候就算是给title创建索引，索引也是失效的，所以它走的是一个全表扫描然后一条一条匹配关键字进而获取到搜索数据，这样的效率是底下的。如果数据量非常庞大，这个时候还全文扫描，那性能是非常差的。

2、什么是倒排索引：

由上述的背景下，提出了倒排索引。
请添加图片描述 2.1 文档：
每条数据就是一个文档；把表中的每条数据起一个新的名称，以前叫记录，现在叫文档；
2.2 词条：
对文档的内容，按照语义分成的词语。
2.3 倒排索引的认识：
倒排索引在创建的时候，会形成一个新的表，这个表有词条和文档id。
它会把title中的字段按照语义分成一个一个词汇，比如说：“小米手机”会被分成“小米”和“手机”两个词条，然后分别存放到新的表中，然后把这个记录的id，也就是文档的id存放到文档id中。然后再分“华为手机”，分成“华为”和“手机”，但是“手机”已经有了，所以不会再次存入到词条中。然后把华为手机这个记录的id存放到词条为“华为”和“手机”的表中。