讲倒排索引之前先讲正牌索引,意思就是我们的所有文档都有唯一一个文档id,根据文档里的内容算出每个文档中关键字的内容和次数,类似于通过key去找value的形式,如果正牌索引,我们每次寻找关键字查询,就得搜索所有的文档去看是否有这个关键字,这样查询效率太慢了。
于是有了倒排索引,是通过关键字去查文档,我们建立一个索引库,里面的key是关键字,value是每个文档的id,倒排在构建索引的时候较为耗时且维护成本较高,但是搜索耗时短,所以我们可以定时去更新索引库。
查询出来的文档可以通过一个打分算法来进行排序。
面试题:什么是倒排索引?
最新推荐文章于 2024-04-23 13:56:49 发布