lucence小例子-注释详解

最新推荐文章于 2021-02-27 22:09:43 发布

技术人宝哥

最新推荐文章于 2021-02-27 22:09:43 发布

阅读量1.1k

点赞数

分类专栏： lucene 文章标签： string query 存储 asp.net spring class

本文链接：https://blog.csdn.net/code52/article/details/6291073

版权

lucene 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

1、创建索引

package demo;

import java.io.IOException;

public class CreateIndex {

public static void main(String[] args) throws CorruptIndexException, LockObtainFailedException, IOException {
  //创建标准分析器可用于分词
    Analyzer luceneAnalyzer = new StandardAnalyzer();
    //索引文件所在目录   分析器   索引文件没有创建，有就覆盖(false:在原来的基础上创建)    域的长度没有限制
    IndexWriter indexWriter = new IndexWriter("e:/sou",luceneAnalyzer,true,IndexWriter.MaxFieldLength.UNLIMITED);
    //创建字符串数组
    String[] arrstr = new String[18];
    arrstr[0]="昭珂刘ajax jsf spring ";
    arrstr[1]="小鹿中鹿老鹿 ";
    arrstr[2]="DNF 张冲 asp.net c# 北京 ";
    arrstr[3]="王衍伟山东   北京大学 ";
    arrstr[4]="张永博美女 ";
    arrstr[5]="朱翠武撒旦 ";
    arrstr[6]="纪伟乔奥运 ";
    arrstr[7]="孙海龙纽约五角大楼 ";
    arrstr[8]="利辉徐魔兽世界 ";
    arrstr[9]="薛新峰北京联想公司 ";
    arrstr[10]="孙津津 jquery ";
    arrstr[11]="马晨智 java工程师 ";
    arrstr[12]="丁钰清华大学美女 ";
    arrstr[13]="港港卢人体艺术 ";
    arrstr[14]="刘宗武柑橘 ";
    arrstr[15]="刘宗武白果 ";
    arrstr[16]="刘宗武鸭梨 ";
    arrstr[17]="刘宗武哈密瓜 ";
    int i=0;
   for (String str:arrstr){
   i++;
   //Document相当于一行记录
   Document doc=new Document();
   // Field相当于一个字段               名字            是否存储           不作为搜索字段
   Field fid=new Field("id",""+i, Field.Store.YES,Field.Index.NO);
   //                   名字     字段值     存储          作为搜索字段
   Field fbody=new Field("body",str,Field.Store.YES,Field.Index.ANALYZED);
   doc.add(fid);
   doc.add(fbody);
   indexWriter.addDocument(doc);
    }
   //写向文件
indexWriter.optimize();
   //当调用close时候才将索引存入磁盘
indexWriter.close();
}
}

2、搜索

package demo;

import java.io.IOException;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.CorruptIndexException;
import org.apache.lucene.queryParser.ParseException;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocCollector;
import org.apache.lucene.search.TopDocs;

public class SearchIndex {

public static void main(String[] args) throws CorruptIndexException, IOException, ParseException{
  String queryString = "刘山东";
  //索引搜索器
  IndexSearcher searcher=new IndexSearcher("e:/sou");

  //创建标准分析器可用于分词
     Analyzer luceneAnalyzer = new StandardAnalyzer();
     //查询解析器
     QueryParser parser=new QueryParser("body" ,luceneAnalyzer );
     //把分析结果放入Query对象存储
     Query query=parser.parse(queryString);
     //创建容器
     TopDocCollector collector=new TopDocCollector(5);
     //搜索     传入分析结果     存储搜索结果
     searcher.search(query, collector);
     //处理等到Document对象
     TopDocs topDocs=collector.topDocs();
     ScoreDoc[] score=topDocs.scoreDocs;
     for(ScoreDoc s:score ){
     //获得document 的唯一标识
     int docId=s.doc;
     //根据唯一标识查找Document对象
     Document doc=searcher.doc(docId);
     //根据域名字取域对应的值
     System.out.println(doc.get("id")+":"+doc.get("body"));
     }
}
}