lucene
文章平均质量分 71
starxu85
这个作者很懒,什么都没留下…
展开
-
Lucene构建index性能调整
1、调整MaxBufferedDocs和MergeFactor,经过调试,发现MaxBufferedDocs=1000,MergeFactor=100时性能较好。indexModifier = new IndexModifier(@"c:/indexpath",new StandardAnalyzer(),true);indexModifier.SetMaxBufferedDocs(1000)原创 2008-02-24 18:58:00 · 803 阅读 · 0 评论 -
Using Nutch 0.8.1 for Intranet Crawling and Searching
本文尝试使用 Nutch 0.8.1 来为几个指定的网站建立全文索引,且不使用 Hadoop 提供的分布式能力,只是简单地在一台单独的机器上完成索引工作。如果需要使用 Nutch 的分布式能力,需要熟悉一下 Hadoop.约定 Nutch 部署后的目录结构如下:/home/hys/nutch-deployed /nutch-0.8.1 (Nutch 0.8.1 instal原创 2008-02-26 00:44:00 · 669 阅读 · 0 评论 -
MultiSearcher在多个索引上搜索
以前的搜索都是单域搜索,下面就是多域搜索MultiFieldQueryParserpublic static Query parse(String[ ] queries,String[ ] fields,BooleanClause.Occur.[ ] flags,Analyzer analyzer) t hroiws ParseExceptonqueries 表示要查找的域中关键原创 2008-08-03 14:51:00 · 1574 阅读 · 0 评论 -
ParalellMultiSearcher:多线程搜索
package ch4.searcher;import java.io.IOException;import org.apache.lucene.analysis.standard.*;import org.apache.lucene.document.*;import org.apache.lucene.index.*;import org.apache.lucene.search.*;im原创 2008-08-03 14:47:00 · 1098 阅读 · 0 评论 -
lucene IndexReader reOpen 的彻底研究
一直觉得lucene的reopen有问题,今天特地研究了下,顺便熟悉了整个IndexReader的结构体系IndexReader是一个体系,他是search的核心io之一org.apache.lucene.index Class IndexReaderjava.lang.Object org.apache.lucene.index.IndexReader Direct Kn原创 2009-02-18 13:03:00 · 5879 阅读 · 0 评论