Lucene
iteye_15928
这个作者很懒,什么都没留下…
展开
-
Lucene2.0检索方式
取得检索信息:方式一:for(HitIterator iter=(HitIterator)hits.iterator();iter.hasNext();){Hit hit=(Hit)iter.next();//Document doc=hit.getDocument();hit.get("title");hit.get("body");}方式二:for(int i=0;i Doc...2007-01-04 16:43:45 · 120 阅读 · 0 评论 -
Lucene之Field
doc.add(new Field("file",file.getName(),Field.Store.YES,Field.Index.NO));//doc.add(Field.UnIndexed("file", file.getName())); 后者在lucene的后续版本中找不到了,可能是被抛弃的方法吧.现在用上面的方法代替.org.apache.lucene.analysis包or...2007-01-04 16:49:43 · 109 阅读 · 0 评论 -
Lucene文件格式
生成的文件如下:_21.f1,_21.f2,依次类推,扩展名根据文件排序;_21.fdt;_21.fdx; *.fdt和*.fdx构成了域值存储表;_21.fnm; 记录了域集合信息;_21.frq; 记录了项的位置;_21.prx; 记录了项频数;_21.tii; _21.tis; *.tii和*.tis构成了项字典;segment1.nrm 记录了标准化因子;segment...2007-03-08 16:22:17 · 127 阅读 · 0 评论 -
lucene之分词,索引,存储
全文检索(lucene):刚接触lucene时,对分词,索引,存储不是很了解,经过深入的学习,逐渐连接了这三个的概念;1,分词:就是剔除掉常见到词(当然这里可以自定义那些要被剔掉的词),如"我是java程序员,我用eclipse开发java",一般人搜索不会输入"我","用","开发"这些词,我们把它们剔除掉,就剩下"java","程序员","eclipse",&2007-03-21 14:57:49 · 511 阅读 · 0 评论