自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (3)
  • 收藏
  • 关注

原创 PhraseQuery的分析

     PhraseQuery是lucene当中比较有特点的一种查询,它可以限定结果中两个term之间的距离。     比如      PhraseQuery query=new PhraseQuery();     query.add(new Term("contents","abc");     query.add(new Term("contents","def"); 

2007-08-24 18:56:00 4949 1

原创 BooleanQuery的分析

       对于一次检索,检索的结果应该和查询相关,同时也应该和索引相关,所以lucene中常用                                                  searcher.search(query)来完成查询功能,searcher考虑了索引,query则考虑了查询的特点。       lucene提供一个Query的抽象类来定义查询。由于查询

2007-08-23 18:10:00 3092

原创 lucene的索引文件

       通过实际的程序我们可以观察到,如果不使用复合文件格式来创建索引的话,索引文件很多,这些索引文件记录和Field,Term相关的种种信息,这些信息以一定的格式存放在文件中,并且使用了压缩等多项技术来减少空间占用,不过lucene的压缩结构并没有使查找效率明显降低,适当的冗余还是存在与索引中。        大部分的搜索(数据库)引擎都是用B树结构来维护索引,索引的更新会导致大量的I

2007-08-22 19:54:00 1796

原创 lucene源代码分析(index部分)

         lucene的索引          lucene对一系列的文件进行索引时,首先会将物理文件映射为Document类型的文件。Document中包含有和检索相关的field,这个过程将一些感兴趣的内容提取出来,而之后所有的检索都是基于Document的。          lucene的索引分为两种,一种是将不同索引信息写到不同的文件中,一种是使用复合文件索引格式,该索引

2007-08-22 15:47:00 3263 2

原创 lucene 源代码的分析(search部分)

      lucene的源代码中各种调用关系不是非常明显,往往你中有我,我中有你,这种写程序的方法对于初次接触的源码的人多少有些困惑,但是从整个程序的结构上来讲,这样的工具包使用起来会更加方便一些,封装的层次性较好,扩展性高。这种抽象的思想很值的研究。      下面是笔者对lucene中search的主体部分(org.apache.lucene.seach)进行的分析。常见的search的

2007-08-20 14:44:00 3233

linux assembly

assembly about linux platform

2008-07-20

linux programming unleashed.pdf

something you don't know about linux

2008-05-31

linux讲义

比较全的入门级linux讲义

2007-09-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除