防暴力破解

最新推荐文章于 2024-04-14 17:54:46 发布

wbj0110

最新推荐文章于 2024-04-14 17:54:46 发布

阅读量137

点赞数

分类专栏： Lucene 文章标签： lucene

本文链接：https://blog.csdn.net/wbj0110/article/details/84611090

版权

Lucene 专栏收录该内容

33 篇文章 0 订阅

订阅专栏

包：

lucene-analyzers-3.6.1.jar

lucene-core-3.6.1.jar

lucene-highlighter-3.6.1.jar

lucene-smartcn-3.6.1.jar

     Java代码   
     
   
package com.nanjing.chaoxing.lucene;  
  
import java.io.File;  
import java.io.FileReader;  
import java.io.IOException;  
  
import org.apache.lucene.analysis.Analyzer;  
import org.apache.lucene.analysis.cn.smart.SmartChineseAnalyzer;  
import org.apache.lucene.document.Document;  
import org.apache.lucene.document.Field;  
import org.apache.lucene.index.IndexReader;  
import org.apache.lucene.index.IndexWriter;  
import org.apache.lucene.index.IndexWriterConfig;  
import org.apache.lucene.queryParser.MultiFieldQueryParser;  
import org.apache.lucene.queryParser.ParseException;  
import org.apache.lucene.queryParser.QueryParser;  
import org.apache.lucene.search.IndexSearcher;  
import org.apache.lucene.search.Query;  
import org.apache.lucene.search.ScoreDoc;  
import org.apache.lucene.search.TopDocs;  
import org.apache.lucene.store.Directory;  
import org.apache.lucene.store.FSDirectory;  
import org.apache.lucene.util.Version;  
import org.junit.Test;  
  
public class LuceneStudy {  
        private String dataSourceFile = "D:\\test\\luceneDataSource";  
        private File indexFile=new File("D:\\test\\luceneIndex");  
        //创建简单中文分析器    
        private Analyzer analyzer = new SmartChineseAnalyzer(Version.LUCENE_36,true);    
        private String[] queryString={"filepath","content"};    
        /**  
         * 创建索引  
         *  
         * @throws IOException  
         */    
        @Test    
        public void createIndex() throws IOException {    
            //创建索引目录    
            Directory directory = FSDirectory.open(indexFile);    
            //建立索引创建类    
            IndexWriterConfig indexWriterConfig = new IndexWriterConfig(Version.LUCENE_36, analyzer);    
            indexWriterConfig.setOpenMode(IndexWriterConfig.OpenMode.CREATE);  //总是重新创建索引  
            IndexWriter writer = new IndexWriter(directory, indexWriterConfig);    
        
            //建立索引    
            File[] files = new File(dataSourceFile).listFiles();    
            if (files.length > 0) {    
                long time1 = System.currentTimeMillis();    
                for (int i = 0; i < files.length; i++) {    
                    Document document = new Document();    
                    document.add(new Field("content", new FileReader(files[i])));    
                    document.add(new Field("filepath", files[i].getName(), Field.Store.YES, Field.Index.ANALYZED));    
                    writer.addDocument(document);    
                }    
                long time2 = System.currentTimeMillis();    
                System.out.println("创建了" + writer.numDocs() + "索引");    
                System.out.println("一共花了" + (time2 - time1) + "时间");    
            }    
        
            writer.close();    
        }    
        
        /**  
         * 搜索文档  
         * @throws IOException  
         * @throws ParseException  
         */    
        @Test    
        public void search() throws IOException, ParseException {    
        
            IndexReader indexReader = IndexReader.open(FSDirectory.open(indexFile));    
            //创建搜索类    
            IndexSearcher indexSearcher = new IndexSearcher(indexReader);    
            QueryParser queryParser = new MultiFieldQueryParser(Version.LUCENE_36, queryString, analyzer);    
            Query query = queryParser.parse("大幅度");    
            TopDocs topDocs = indexSearcher.search(query, 10000);    
            System.out.println("一共查到:" + topDocs.totalHits + "记录");    
            ScoreDoc[] scoreDoc = topDocs.scoreDocs;    
        
            for (int i = 0; i < scoreDoc.length; i++) {    
                //内部编号    
                int doc = scoreDoc[i].doc;    
                System.out.println("内部编号:" + doc);    
                //根据文档id找到文档    
                Document mydoc = indexSearcher.doc(doc);    
                System.out.println("文档路径:" + mydoc.get("filepath"));    
            }    
        }    
        
        
    }