Lucene
文章平均质量分 78
okenan123
这个作者很懒,什么都没留下…
展开
-
Lucene索引创建之域选项介绍,Field.Store和Fiele.Index
基于jar lucene3.6.2Field.Store.YES / NO --- 存储选项设置为YES表示把这个域中的内容完全存储到文件中,方便进行文本的还原设置为NO表示把这个域的内容不存储到文件中,但是可以被索引,此时内容无法完全还原Field.Index. --- 索引选项ANALYZED 进行分词和索引,适用于标题,内容等NOT_ANALYZED 进原创 2013-04-01 16:15:15 · 614 阅读 · 0 评论 -
lucene中搜索
import java.io.File; import java.io.IOException; import java.text.ParseException; import java.text.SimpleDateFormat; import java.util.Date; import org.apache.lucene.analysis.standard.StandardAnalyzer原创 2013-04-01 16:15:28 · 316 阅读 · 0 评论 -
IndexWriter和IndexReader对象分析
IndexWriter和IndexReader对象的创建都是非常耗时的操作对于IndexReader一般用IndexReader创建一个Searcher对象来进行操作,但是这个时候,如果用writer对索引进行了更新,searcher对象不能实时的相应出来,所以用一下方法来创建searcher public boolean getSearcher(){ try {原创 2013-04-01 16:15:23 · 537 阅读 · 0 评论 -
lucene中好用的两个工具luke和Tika
Luke是一个用于Lucene搜索引擎的,方便开发和诊断的第三方工具,它可以访问现有Lucene的索引,并允许您显示和修改。Apache Tika 可以利用现有的类库,从不同的格式文档中读取数据。利用Tika和Lucene的集成可以方便的对文档进行索引。利用tika解析文档的例子这里使用的是tika-1.2.jar package test; import java.原创 2013-04-01 16:15:40 · 452 阅读 · 0 评论 -
lucene搜索中filter的使用
import java.io.File; import java.io.IOException; import java.text.ParseException; import java.text.SimpleDateFormat; import java.util.Date; import org.apache.lucene.analysis.standard.StandardAnalyzer原创 2013-04-01 16:15:38 · 420 阅读 · 0 评论 -
lucene,基于QueryParser的搜索
public void queryParse(Query query , int num ){ try { TopDocs tds = this.searcher.search(query, num); System.out.println("查询到的结果数:"+tds.totalHits); for(Scor原创 2013-04-01 16:15:30 · 318 阅读 · 0 评论 -
lucene加权操作和luke的简单演示
权值越高的文档在搜索中排名越靠前,那么怎么通过程序控制文档的权值呢? writer = new IndexWriter(directory, new IndexWriterConfig(Version.LUCENE_35, new StandardAnalyzer(Version.LUCENE_36))); doc = new Document();原创 2013-04-01 16:15:19 · 445 阅读 · 0 评论 -
Lucene索引操作,删除,更新,优化
IndexUtil.java import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Document; import org.apache.lucene.docum原创 2013-04-01 16:15:17 · 341 阅读 · 0 评论 -
Lucene介绍和创建索引和搜索初步
Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。以上介原创 2013-04-01 16:15:12 · 314 阅读 · 0 评论 -
lucene学习之搜索排序
import java.io.File; import java.io.IOException; import java.text.ParseException; import java.text.SimpleDateFormat; import java.util.Date; import org.apache.lucene.analysis.standard.StandardAnalyzer原创 2013-04-01 16:15:36 · 345 阅读 · 0 评论 -
lucene自定义停用词分词器和mmseg中文分词器
import java.io.Reader; import java.util.Set; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.LetterTokenizer; import org.apache.lucene.analysis.LowerCaseFilter; import o原创 2013-04-01 16:15:34 · 502 阅读 · 0 评论 -
lucene的搜索,TermQuery,TermRangeQuery,NumericRangeQuery
SearchUtil.java import java.io.File; import java.io.IOException; import java.text.ParseException; import java.text.SimpleDateFormat; import java.util.Date; import org.apache.lucene.analysis.standard.原创 2013-04-01 16:15:25 · 381 阅读 · 0 评论 -
lucene对数字和日期类型索引的创建
private int[] attachs = {1,4,6,2,3,8}; private Date[] dates = null; //日期的初始化 private void datesInit() { SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd"); dates = new Date[6];原创 2013-04-01 16:15:21 · 403 阅读 · 0 评论 -
lucene中的四种分词器
import java.io.IOException; import java.io.StringReader; import javax.swing.text.AttributeSet.CharacterAttribute; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.Simple原创 2013-04-01 16:15:32 · 352 阅读 · 0 评论