精彩文章 一、正排索引 从document到关键词的映射过程 最常规的搜索是这样的,从所有doumnet中查询指定的关键词,也就是说必须查询所有的文档,才能保证查询的完整。 这样有个非常明显弊端,如果数据量很大,那么效率可想而知。 二、倒排索引 从关键词到document的映射过程 它会维护一张表,该表记录关键词和文档的映射关系,并且记录在文档的位置和出现的次数等信息,每次查询的时候只要查询这张表即可。 一篇不错的文章