Lemur的检索过程

Lemur的检索过程如下图所示,主要包括语句的解析,索引的查找,打分和排序三个部分,具体过程如图四所示。

    查询执行是按以下步骤执行的:

1.        根据查询语句中要查询的单词term去frequentString或infrequentString中找出倒排索引在invertedFile中的起始位置和长度。

2.        根据1中得到的invertedFile中的起始位置和长度,读取该单词的倒排索引。

3.        根据查询语句中要查询的元素结点field,由manifest中得到它的倒排索引在fieldsFile中的起始位置和长度,并读取。

4.        根据元素结点的起始和结束编号以及单词的位置编号,判断满足查询路径的元素结点和单词的tf

5.        根据directFile重构文档的结构信息,并把4中得到的满足查询路径的元素结点和单词,依照Lemur的检索模型进行打分。

5中得到的结果,排序输出。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值