关于QueryParser类前后修改

在升级Lucene版本至4.3并实现实时索引的过程中,发现搜索结果数量发生变化。研究发现,QueryParser在新旧版本间产生了不同的解析行为。旧版返回精确的短语匹配,而新版则拆分成独立关键词,导致更多搜索结果。这涉及到Lucene的查询打分机制和用户输入错误的容错性。哪种效果更优,需要通过大量数据测试来决定。
摘要由CSDN通过智能技术生成


转载请注明出处:http://blog.csdn.net/xiaojimanman/article/details/16972661

    这几天在公司做一个项目,就是去将以前的老项目的lucene版本切换成4.3版本,并将以前的索引架构修改为实时索引(公司以前的那个项目是好几年前的了),为了和以前的版本兼容,第一步就是只是把lucene版本修改下,同时支持实时索引,至于所有的接口,都要和以前一样。在这中间就遇到了一个很大的问题,就是在出搜索结果的时候,修改后的版本要比以前的版本多很多搜索结果(上面要求要和原来的接口出的数据完全一样),函数也是用的以前的,为什么就出现不同的结果呢?

     最后通过读源代码,发现是QueryParser类在作怪,下面先看一下QueryParser在前后3.1前后两个版本中的效果:


 /**  
 *@Description:     
 */ 
package cn.lulei.test;  

import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.queryparser.classic.ParseException;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.Q
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值