![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Lucene
文章平均质量分 78
爱涵雨
这个作者很懒,什么都没留下…
展开
-
Lucene之一(Lucene的概念一)
Lucene的基本概念 Lucene是什么? Lucene是一款高性能、可扩展的信息检索工具库。信息检索是指文档搜索、文档内信息搜索或者文档相关的元数据搜索等操作。 信息检索流程如下: 1、 将即将检索的资源集合放到本地,并使用某种特定的结构存储,称为索引,这个索引的集合称为索引库。由于索引库的结构按照专门为快速查询设计的,所以查询的速度非常的快; ...2012-12-20 15:31:51 · 128 阅读 · 0 评论 -
Lucene之二(文件操作类1-RAMDirectory)
由上一文章,我们知道Lucene中的索引库的概念,我们可以把索引库理解是一个目录,里面是一些二级制文件,就如同数据库,所有的数据也是以文件的形式存放在文件系统中的。那么在Lucene中文件是怎么存储到索引库中,在Lucene中资源存储的API工具有哪些呢,各有什么特点?这节我们着重说说这些问题。 Lucene资源存储靠的Dircetory类(这是一个抽象类,真正实现靠其子类),在...2012-12-21 11:33:41 · 264 阅读 · 0 评论 -
Lucene之三(文件操作类2-FSDirectory)
FSDirectoryFSDirectory是Lucene对文件系统的操作,它有下面三个子类SimpleFSDirectory、MmapDirectory、NIOFSDirectory; FSDirectory是一个抽象类,具体实现由子类来完成。 1、SimpleFSDirectory 最简单的FSDirectory子类,使用java.io.*API将文...2012-12-21 11:54:44 · 741 阅读 · 0 评论 -
Lucene之四(文件操作类3-FileSwitchDirectory)
FileSwitchDirectory FileSwitchDirectory是lucene的另一种Directory实现类,从名字个就可以理解为文件切换的Directory实现,是针对lucene的不同的索引文件使用不同的Directory .借助FileSwitchDirectory整合不同的Directory实现类的优点于一身。 比如MMapDirectory,借助内存映...2012-12-21 11:58:00 · 130 阅读 · 0 评论 -
Lucene之五(Analysis分析器)
在搜索的过程中,有两个地方会用到分析器,一个就是建索引的时候,我们都知道,Lucene是以倒排的方式建索引的。我们来看下倒排序的概念倒排序索引 在对文档进行预处理,建立一种便于检索的数据结构,以此来提供信息检索的速度,这种数据结构就是索引。目前广泛使用的一种索引方式是倒排序索引。 倒排序索引的原理就如同查字典。要先查找目录,得到数据对应的页面,在直接翻到指定的页面。不...2012-12-21 14:58:26 · 113 阅读 · 0 评论 -
Lucene之六(Lucene内置Analysis分析器)
1、WhitespaceAnalyzer 仅仅是去除空格,对字符没有lowcase化,不支持中文; 并且不对生成的词汇单元进行其他的规范化处理。2、SimpleAnalyzer 功能强于WhitespaceAnalyzer, 首先会通过非字母字符来分割文本信息,然后将词汇单元统一为小写形式。该分析器会去掉数字类型的字符。3、StopAnalyzer...2012-12-21 15:56:48 · 174 阅读 · 0 评论 -
Lucene之七(开源的中文分析器)
当前的中文分析器大致的有以下几个1、IK Analyzer 基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始, IKAnalyzer已经推出了4个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。从3.0版本开始,IK发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默...原创 2012-12-22 09:35:24 · 201 阅读 · 0 评论 -
Lucene之八(Lucene的高亮显示)
在Lucene的org.apache.lucene.search.highlight包中提供了关于高亮显示检索关键字的工具。我们在使用百度、Google搜索的时候,检索结果显示的时候,在摘要中实现与关键字相同的词条进行高亮显示,百度和Google指定红色高亮显示。 有了Lucene提供的高亮显示的工具,可以很方便地实现高亮显示的功能。 高亮显示,就是根据用户输入...2012-12-22 10:57:01 · 378 阅读 · 0 评论 -
Compass基础知识一
1、Compass简单介绍Compass是一个强大的,事务的,高性能的对象/搜索引擎映射(OSEM:object/searchengine mapping)与一个Java持久层框架。 Compass包括以下功能: * 搜索引擎抽象层(使用Lucene搜索引荐), * OSEM (Object/Search Engine Mapping...原创 2012-09-22 17:18:33 · 108 阅读 · 0 评论