smartgayID:smartGay
2447次访问,排名2万外好友0人,关注者0
smartGay的文章
原创 5 篇
翻译 0 篇
转载 0 篇
评论 2 篇
最近评论
agjyfm:wow gold
LynnKaye:您好
我最近需要写一个简单的输入关键字然后在文件中检索然后ranking的东西,但是我以前没有接触过这方面的东西,什么都不懂,现在写了一个很粗糙的,效率也不高,请问有没有什么可以参考的资料啊?
我的邮箱是LynnKaye@gmail.com
文章分类
    收藏
      相册
      lucene官网
      存档
      软件项目交易
      订阅我的博客
      XML聚合  FeedSky
      订阅到鲜果
      订阅到Google
      订阅到抓虾
      订阅到BlogLines
      订阅到Yahoo
      订阅到GouGou
      订阅到飞鸽
      订阅到Rojo
      订阅到newsgator
      订阅到netvibes

      原创 PhraseQuery的分析收藏

       | 旧一篇: BooleanQuery的分析

           PhraseQuery是lucene当中比较有特点的一种查询,它可以限定结果中两个term之间的距离。

           比如

            PhraseQuery query=new PhraseQuery();

           query.add(new Term("contents","abc");

           query.add(new Term("contents","def");

           query.setSlop(5);//要求结果中不仅包含上面的term,并且两个Term之间的间隔不能超过5

           searcher.search(query);

          ......................

            下面的UML图说明了PhraseQuery的实现的过程

               PhraseScorer依然是继承自Scorer,PhraseQuery依然继承自Query,整个的查询逻辑都被在searcher.search()中定义了,PhraseScorer.score()方法给出了这种查询的分值计算方法。并且根据Term之间间隔的大小(setSlop()中设定的Slop的长度),phraseFreq的计算方法会不同,这时定义了两个具体的类ExactPhraseScorer和SloppyPhraseScore,给出了phraseFreq()的实现。并且子类填充父类中的PhraseQueue对象(在父类中只是定义PhraseQueue对象),这便是该部分的抽象机制。

             由于PhraseQuery涉及到不同的Term之间的间隔,所以将term和查询相关的信息<docNum, freq, <pos1, pos2, ... posfreq-1> >* 封装为TermPositions类,该类比较特殊,它没有上面的字段,但是提供了nextPosition()来遍历所有的term位置信息。

             PhraseWeight.scorer()使用 IndexReader.termPositions(Term)返回TermPosition对象,该对象被传递到Scorer的PhrasePosition对象中,PhrasePosition是对TermPosition的一个封装,在ExactPhraseScorer和SloppyPhraseScorer类中被用来计算phraseFreq信息。

          

       

      发表于 @ 2007年08月24日 18:56:00|评论(loading...)|编辑

       | 旧一篇: BooleanQuery的分析

      评论:没有评论。

      发表评论  


      当前用户设置只有注册用户才能发表评论。如果你没有登录,请点击登录
      Csdn Blog version 3.1a
      Copyright © smartGay