lucene学习 内存索引库和文件索引库结合

原创 2016年05月30日 15:18:00
在lucene索引库的创建的时候,我们有两种不同的索引库创建方式

1.文件索引库

final Path docDir = Paths.get("index");
Directory directory=FSDirectory.open(Paths.get("index"));
这样创建的索引库是在本地磁盘上创建一个index文件夹,并且将索引放在index中,也称为文件索引库
优点:将索引持久化到磁盘上,能长久保存。
缺点:相比较内存索引库,读取慢

2.内存索引库

Directory directory = new RAMDirectory();
只需要一句代码,就创建了一个内存索引库
优点:读取快
缺点:不具备持久化能力,结束时候内存索引库便会删除

3.两种索引库的结合

根据两种索引库的特点我们可以将两种索引库结合起来,设计的思路是在程序启动时,将文件索引库中的索引拷贝到内存索引库中,然后让程序与内存索引库交互,当交互完毕后再将内存索引库的索引持久化到文件索引库。
/**
         * 1.创建两个索引库
         * 2.创建两个IndexWriter
         * 3.把文件索引库中的内容放到内存索引库中
         * 4.让内存索引库和客户端进行交互
         * 5.把内存索引库的内容放到文件索引库
         */
        final Path docDir = Paths.get("index");
        //创建文件索引库
        Directory fileDirectory=FSDirectory.open(Paths.get("index"));
        //创建内存索引库
        Directory ramDirectory = new RAMDirectory(FSDirectory.open(Paths.get("index")), null);

        Analyzer analyzer = new StandardAnalyzer();
        IndexWriterConfig iwc = new IndexWriterConfig(analyzer);
        //操作文件的IndexWriter
        IndexWriter fileIndexWriter = new IndexWriter(fileDirectory, iwc);
        //操作内存的IndexWriter
        Analyzer analyzer1 = new StandardAnalyzer();
        IndexWriterConfig iwc1 = new IndexWriterConfig(analyzer1);
        IndexWriter ramIndexWriter=new IndexWriter(ramDirectory, iwc1);

        Article article = new Article();
        article.setAid(1L);
        article.setTitle("lucene是一个全文检索引擎");
        article.setContent("baidu,google都是很好的全文检索引擎");

        // 创建document
        Document document = new Document();
        Field idField = new Field("aid", article.getAid().toString(),
                TextField.TYPE_STORED);
        Field titleField = new Field("title", article.getTitle().toString(),
                TextField.TYPE_STORED);
        Field contentField = new Field("content", article.getContent()
                .toString(), TextField.TYPE_STORED);
        document.add(idField);
        document.add(titleField);
        document.add(contentField);

        //把document放到内存当中
        ramIndexWriter.addDocument(document);
        ramIndexWriter.close();
        //把内存索引库的内容合并到文件索引库
        fileIndexWriter.addIndexes(ramDirectory);
        fileIndexWriter.close();
版权声明:本文为博主原创文章,未经博主允许不得转载。

Lucene学习笔记-内存与文件索引的简单操作

Lucene 内存索引、文件索引的一些简单操作

lucene内存索引库、分词器

6.3内存索引库 6.3.1特点                   在内存中开辟一块空间,专门为索引库存放。这样有以下几个特征: 1)    因为索引库在内存中,所以访问速度更快。 2)    在...

lucene使用内存索引时一些问题OutOfMemoryError: Java heap space

我在做【文件搜】网站用到的: 高速版(Java+Lucene)  http://wjsou.com:8080/ 低速版(PHP+MySQL)     http://wjsou.com 高速版:...

struts2默认各个拦截器的作用说明

 struts2默认各个拦截器的作用说明(1)在xml配置文件中配置拦截器和拦截器栈都是以“”开头,以“”结尾。 (2)配置拦截器的格式如上面代码所示以“”格式显示,其中两个属性name是...

Struts2默认拦截器解析

Struts2默认拦截器解析(一)   2011-09-11 19:52:42|  分类: struts2 |  标签:java  拦截器  struts2  默认拦截器  拦截器栈   |...

Lucene总结系列(三)--总述优化方案和呈现实时内存索引实现(结合RAMDirectory源码解析)

前两篇讲清楚基础和基本api调用,接下来我们就是要进入优化篇章了。 这一篇讲述总体的优化方案,以及结合源码解析实时内存索引的实现(结合RAMDirectory源码)。...

内存索引库

  • 2017年05月08日 08:09
  • 67KB
  • 下载

lucene 中文分词 内存索引

//package org.wltea.analyzer.sample; import java.io.IOException; import org.apache.lucene....
  • fanpeii
  • fanpeii
  • 2012年05月12日 21:47
  • 1843

文件索引库和内存索引库的交互

package cn.itcast.lucene.directory; import java.io.File; import java.util.ArrayList; import jav...

内存索引的实际应用中选择T树还是B树

January 5th, 2012adminLeave a commentGo to comments 一、T树与B树的比较 在T树最开始被提出的时候,其CPU效率被认...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:lucene学习 内存索引库和文件索引库结合
举报原因:
原因补充:

(最多只允许输入30个字)