学习elasticsearch搜索引擎,哪知道什么叫倒排索引,反正一脸懵。
分享一下看了几篇文章之后的心得:
倒排、倒排,得现有正排。什么是正排?正排就是,真正的排骨,说错了!
正排索引:
存储时:
简单讲就是,文档Id为序,将文档中的分词(关键词)进行整理排列,整理什么呢?排列什么呢?
整理关键词 出现的次数 和 所在位置。
查询时:
一个文档一个文档,找关键词,直到找到涉及关键词的所有文档,才Over,看着就累,不要说找了。
因为找得累,所以就出来个 倒排索引 ,就是倒着来。
那就是,以关键词为序,整理文档来着。具体怎么整理来着,没搞懂,以后有机会再补充!
这样就快很多了,关键词与文档的对应关系整理好了,通过关键词,一下就找到文档了。
不过存储起来麻烦,查询起来快。没有完美的解决的方案,只有适合的方案(感觉是这种后的方案,有点中庸之意)。
参考:(1)https://blog.csdn.net/u011243684/article/details/85264284
(2)https://www.cnblogs.com/AndyStudy/p/9042032.html
(3)https://www.cnblogs.com/softidea/p/9852048.html