什么是倒排索引
倒排索引的意思是索引为词内容为文档id,数据库是文档ID为索引 文档内容为记录,所以叫倒排索引。
比如数组我们是根据索引获取内容,是正的,
如果我们根据内容获取索引,就是反的,内容作为索引,索引作为内容了。
这样的好处是,创建索引时,例如,记录一个词 “的” 在这篇文章中出现的所有位置,
索引为 “的” ,"的"出现的位置作为此索引的值,这样就能快速定位这个此在文章中的位置。
比如我们百度搜索内容,输入的内容其实是索引。
传统查询,一篇文章的 “的” 字出现的位置,需要一个一个词检索 。
倒排索引,记录一篇文章中 “的” 字出现的位置 “的” 作为索引,出现的位置作为值 ,这样搜索这个词,
出现的位置肯定要快得多。