从前面的分析知道,全文索引根据倒排索引数据进行检索。一个是利用文档倒排过滤出所包含所有查询词的文档,再利用文档偏移倒排进行位置偏移过滤。
doc过滤:
通过文档倒排,就是求每个查询词文档集合的交集。由于单词的文档集合具有有序性,这样就可以做两个有序集合的交集。使用双指针对比偏移算法求交集即可
hitoffset过滤:
只有需要对输入短语进行完全匹配时,需要。通过查询短语的偏移倒排序列和文档的偏移序列对比,查看一致情况。
从前面的分析知道,全文索引根据倒排索引数据进行检索。一个是利用文档倒排过滤出所包含所有查询词的文档,再利用文档偏移倒排进行位置偏移过滤。
doc过滤:
通过文档倒排,就是求每个查询词文档集合的交集。由于单词的文档集合具有有序性,这样就可以做两个有序集合的交集。使用双指针对比偏移算法求交集即可
hitoffset过滤:
只有需要对输入短语进行完全匹配时,需要。通过查询短语的偏移倒排序列和文档的偏移序列对比,查看一致情况。