Lucene基础（一）--入门

最新推荐文章于 2022-05-09 09:15:48 发布

食仁魔法师

最新推荐文章于 2022-05-09 09:15:48 发布

阅读量2.2k

点赞数 4

分类专栏： lucene 文章标签： lucene 全文检索

本文链接：https://blog.csdn.net/fun913510024/article/details/46276699

版权

lucene 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

Lucene介绍

lucene的介绍，这里引用百度百科的介绍

Lucene是apache软件基金会4 jakarta项目组的一个子项目，是一个开放源代码的全文检索引擎工具包，即它不是一个完整的全文检索引擎，而是一个全文检索引擎的架构，提供了完整的查询引擎和索引引擎，部分文本分析引擎（英文与德文两种西方语言）。Lucene的目的是为软件开发人员提供一个简单易用的工具包，以方便的在目标系统中实现全文检索的功能，或者是以此为基础建立起完整的全文检索引擎。Lucene是一套用于全文检索和搜寻的开源程式库，由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程式接口，能够做全文索引和搜寻。在Java开发环境里Lucene是一个成熟的免费开源工具。就其本身而言，Lucene是当前以及最近几年最受欢迎的免费Java信息检索程序库。人们经常提到信息检索程序库，虽然与搜索引擎有关，但不应该将信息检索程序库与搜索引擎相混淆。

了解lucene的相关知识直接进入lucene官网 http://lucene.apache.org/

在lucene的官网我们会发现还会有一个solr的开源的软件，它是基于的一个上层写的应用，lucene给我提供的是类似sdk的功能，开发人员需要更多的自己写代码，而solr相对少些代码。可想而知，如果使用lucene的话，我们可以更多的自定义自己的搜索

Lucene下载安装

进入上面的lucene的官方网站，找到下载后解压就行

根据lucene的版本的不同，需要的jdk的版本也会有差异，这个需要在官方网站上看看说明文档，本次测试使用的lucene4.9，编译的jdk为1.7

Unsupported major.minor version 51.0 xxx
如果出现类似的异常，就是下载的lucene和编译的jdk的版本不对，更新个jdk1.7 就可以

Lucene入门实例

下面是在lucene的官方文档里的一段入门代码

public class LuceneDemo {

    private static final Version version = Version.LUCENE_4_9;

    public static void main(String[] args) throws Exception{
        Analyzer analyzer = new StandardAnalyzer(version);

        // Store the index in memory:
        Directory directory = new RAMDirectory();
        // To store an index on disk, use this instead:
        //Directory directory = FSDirectory.open("/tmp/testindex");

        IndexWriterConfig config = new IndexWriterConfig(version, analyzer);
        IndexWriter iwriter = new IndexWriter(directory, config);
        Document doc = new Document();
        Document doc2 = new Document();
        String text = "This is the text to be indexed.";
        String text2 = "This is the text to be indexed22222.";

        doc.add(new Field("fieldname", text, TextField.TYPE_STORED));
        doc2.add(new Field("fieldname", text2, TextField.TYPE_STORED));
        iwriter.addDocument(doc);
        iwriter.addDocument(doc2);
        iwriter.close();


        // Now search the index:
        DirectoryReader ireader = DirectoryReader.open(directory);
        IndexSearcher isearcher = new IndexSearcher(ireader);

        // Parse a simple query that searches for "text":
        QueryParser parser = new QueryParser(version, "fieldname", analyzer);
        Query query = parser.parse("text");
        ScoreDoc[] hits = isearcher.search(query, null, 1000).scoreDocs;
        // Iterate through the results:
        for (int i = 0; i < hits.length; i++) {
          Document hitDoc = isearcher.doc(hits[i].doc);
          System.out.println("This is the text to be indexed="+hitDoc.get("fieldname"));
        }
        ireader.close();
        directory.close();
    }
}

代码解析

写索引

读索引

从代码可以看到基本操作步骤：

先知名索引的位子，建立读索引的对象
创建查询器 Query（query有很多实现类，例子中用的是QueryParse的方法）
执行search方法，得到ScoreDoc ,解析文档
关闭读写器

Lucene主要元素

Lucene中有几个重要的元素

IndexWriter – 用来创建写索引的对象,与之配合使用的有一个IndexWriterConfig，用来对indexwriter做配置
IndexSearch – 与indexwriter对应，用来读所以
Document – 被索引的内容形成一个document文档
Field – 文档的域
Query – 用来查询的对象
Term – 构建查询
ScoreDoc – 命中的结果集

比如：一篇文章，我们有title,author,createTime,category,content那么这每一个可以看做一个域，整个文章就是一个document,如果搜索内容content包含了lucene的文件，就会更具域content的所有找到有Lucene的文章。

参考文章：

1.Lucene4.10使用教程系列,总共很多篇文章：
Lucene4.10使用教程(一)：常用概念 http://blog.csdn.net/seven_zhao/article/details/42706049
2. Lucene 官网网站文档的入门实例

食仁魔法师

关注

4
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
Lucene基础（一）--入门

Lucene介绍lucene的介绍，这里引用百度百科的介绍 Lucene是apache软件基金会4 jakarta项目组的一个子项目，是一个开放源代码的全文检索引擎工具包，即它不是一个完整的全文检索引擎，而是一个全文检索引擎的架构，提供了完整的查询引擎和索引引擎，部分文本分析引擎（英文与德文两种西方语言）。Lucene的目的是为软件开发人员提供一个简单易用的工具包，以方便的在目标系统中实现全文检
复制链接

扫一扫

专栏目录