全文检索之sphinx源码分析--检索流程

最新推荐文章于 2024-07-03 06:51:41 发布

pzlpy

最新推荐文章于 2024-07-03 06:51:41 发布

阅读量551

点赞数

分类专栏：全文检索文章标签： sphinx 全文检索源码索引结构

本文链接：https://blog.csdn.net/pzlpy/article/details/77622851

版权

全文检索专栏收录该内容

5 篇文章 0 订阅

订阅专栏

Sphinx查询时最关注的是match里面的几个关键字的查询方式，因此每个检索语句下发到每个索引文件中去的时候首先做的就是对关键字进行结构化构建，得到的第一棵树是n叉树，然后这颗n叉树会进行第二次重构，重构以后的就是一颗有序的二叉树，每个二叉树非叶子节点就是需要做的操作，而每个叶子结点都代表了一个关键字。

上图为sphParseExtendedQuery函数构建的一颗n叉树，代表了match(‘affrow_199 & (affrow_0 | affrow_99 | (affrow_1 & affrow_2)) & pokeman & cpt_20170615 ’)这样的一个查询关键字序列。此时的这棵树还不能进入真正的检索，sphinx会在创建ranker时通过sphCreateRanker函数很隐晦的调用ExtRanker_None_c初始化->ExtRanker_c初始化->ExtNode_i::Create，通过create函数创建一颗可操作的二叉树。