关键点:倒排索引
参考文章:http://blog.csdn.net/chunlei_zhang/article/details/38520315
作为搜索,我们传统的方式(正排索引)是从关键点出发,然后再通过关键点找到关键点代表的信息中能够满足搜索条件的特定信息,既通过KEY寻找VALUE。而Lucene的搜索则是采用了倒排索引的方式,即通过VALUE找KEY。而在中文全文搜索中VALUE就是我们要搜索的单词,存放所有单词的地方叫词典。KEY是文档标号列表(通过文档标号列表我们可以找到出现过要搜索单词VALUE的文档)。 正排索引从文档编号找词:


本文介绍了Solr创建索引的原理,特别是倒排索引的概念。通过倒排索引,Solr实现从搜索词快速定位到包含这些词的文档。分词、文档频率、位置信息等要素在索引构建中起到关键作用,有效提升搜索效率。同时,压缩存储技术进一步节省了空间。了解这一过程有助于深入理解Solr全文检索的机制。
最低0.47元/天 解锁文章
2045

被折叠的 条评论
为什么被折叠?



