前言
自己理解的倒排求交:
1: 首先倒排链是排序的,根据docid大小排序
2: 比如现在有两个倒排链(对应于两个term的查询结果),现在需要求交
3: 两个指针在倒排链上移动,先移动拥有较小头的链的首指针,找到大于等于另一个链首的时候,停下
4: 如果等于,则放到记录此docid, 大于则移动另一条
5: 记录下来的docid就是求交后的结果集
如果三条的倒排链求交?
答案是可以同时用三个指针,不要想着两个结束后操作第三个
正文
下面给出Lucene的倒排链求交的过程
链表集合求交
lucene中用的是ConjunctionScorer ,大致过程是每条倒排链不断的推进到小于等于当前最大节点的位置。
首先假设我们已经用query: name=hxx&age=19&... 每个term条件查出来一条倒排链,接下来就要对每个倒排链进行求交,得到满足所有条件的结果集。
将每条倒排链(头指针),按照第一个元素的大小顺序,放到一个循环数组中(对应图中下标为0-7),现在取最arr[7] 的倒排链的第一个元素作为最先要比较的docid(因为它最大,即doc=8),
执行下面过程
首先把倒排链按第一个next排序: