LUCENE专题
文章平均质量分 87
shuangpinglee
这个作者很懒,什么都没留下…
展开
-
lucene不同版本的差别与比较
将以前开发的项目中的lucene从1.4.3升级到2.1,发现编译就不通过,于是对照新的API将程序做了修改,目前本人遇到的API更改有1. IndexReader类 delete(int id)方法改名为deleteDocuemnt(int id), delete(Term t) 方法改名为deleteDocuments(Term t); getFieldN原创 2007-03-30 20:36:00 · 3263 阅读 · 0 评论 -
给Lucene加入性能更好的中文分词1 的一点改动
给Lucene加入性能更好的中文分词1(原创) 前一段时间看到了这http://blog.donews.com/windshow/archive/2005/09/23/564655.aspx文章,觉得写得非常的不错,但使用的时候发现了一个小问题,后来留了这样一帖FileIO.readerToString(reader); 中的FileIo类是怎么写的阿? shuangpin原创 2007-03-30 21:49:00 · 2127 阅读 · 3 评论 -
lucene索引合并与增量索引
利用 Lucene,在创建索引的工程中你可以充分利用机器的硬件资源来提高索引的效率。当你需要索引大量的文件时,你会注意到索引过程的瓶颈是在往磁盘上写索引文件的过程中。为了解决这个问题, Lucene 在内存中持有一块缓冲区。但我们如何控制 Lucene 的缓冲区呢?幸运的是,Lucene 的类 IndexWriter 提供了三个参数用来调整缓冲区的大小以及往磁盘上写索引文件的频率。1.合并因子转载 2007-07-21 16:15:00 · 13348 阅读 · 2 评论 -
基于Lucene的企业级搜索引擎的
基于Lucene的企业级搜索引擎的设计与实现北京易维博科科技有限公司 李天一【摘要】 针对企业文档信息资源丰富而又缺乏有效搜索工具的问题,提出构建企业级搜索引擎。首先分析企业搜索引擎应具有的功能和总体架构,在具体实现过程中,对Lucene索引器进行了深入研究;在抓取器的体系设计中,采用了插件设计思想,来对不同的文档类型解析、抽取;在任务调度方面,实现了一套多任务并行的调度机制;在原创 2007-08-25 09:19:00 · 3974 阅读 · 0 评论