什么是倒排索引?

最新推荐文章于 2022-12-02 11:21:18 发布

weixin_30398227

最新推荐文章于 2022-12-02 11:21:18 发布

阅读量92

点赞数

文章标签：数据库

版权

索引是用来更快的找出需要的信息。

我们一般理解的索引都是正向索引,如数据库表

在这里文档id是主键

如果我们想查找 '单词a‘ ，我们需要从文档1开始逐个列逐个字段去遍历查找才能得出结果

那么搜索引擎怎么做呢

如果是把列x 看成是一篇文章字段x 对应的是该文章的单词，用上面的这个表进行存储的话，我们需要多少列呢？

当查找的时候又该如何查找呢？

每篇文件都由不同的单词组成，单词各不相同，又或多或少。

显然，如果使用上面这个表进行存储，效率低下不说，限于目前计算机的条件，也是不可能实现的。

那么搜索引擎怎么做呢？倒排索引

“倒排索引”这个名词很唬人，其实原理很简单。

其中每条记录，记录的是一个单词都在哪些文档中出现。然后对这些记录进行排序。

举个例子，我们有2篇文档，内容分别如下

生成倒排索引如下

在这里单词是主键

如果我们搜索 ‘honor’ 这个关键字，是不是一下就能将honor所在的文档找出来？

这就是所谓的倒排索引，你看懂了吗？

转载于:https://www.cnblogs.com/hercules9/archive/2012/03/05/2461395.html

关注