Lucene
文章平均质量分 63
Acm_Jiang
这个作者很懒,什么都没留下…
展开
-
Lucene教程(一) 创建索引
简述: 由于Lucene不同的版本差距较大,,此系列教程打算把3.5版本,4.5版本,5.0版本都给出个例子,方便大家学习,也方便自己复习。注:由于Lucene5.0版本是基于JDK1.7开发的,所以想学习的同学请配置1.7及以上的版本。故测试Lucene 6.1.0也适用Lucene 5.0中的代码。Lucene 6.1.0最低要求也是JDK1.7.创建索引可分为主要的几步,我自己试验过,不同的原创 2016-08-04 16:59:22 · 990 阅读 · 0 评论 -
Lucene教程(二) 搜索
搜索可分为如下几步: 创建Directory 创建IndexReader 根据IndexReader创建IndexSearch 创建搜索的Query 根据searcher搜索并且返回TopDocs 根据TopDocs获取ScoreDoc对象 根据searcher和ScoreDoc对象获取具体的Document对象 根据Document对象获取需要的值 下面是例子代码: 3.5版原创 2016-08-04 17:11:34 · 658 阅读 · 0 评论 -
Lucene教程(三) 索引域选项
通过上两篇的学习,想必已经入了门了,今天来看索引域选项中的几个值得设置 先来看一个构造器: /** * Create a field by specifying its name, value and how it will * be saved in the index. Term vectors will not be stored in the index. *原创 2016-08-04 17:50:17 · 1179 阅读 · 0 评论 -
Lucene在Eclipse上的部署And Example
Tools required: Apache lucene – Download Here (After downloading extract the files to the desktop) JDK/JRE 7 – Download Here (Install) Eclipse – Download HereApache Lucene: Lucene is a full text se原创 2016-08-04 17:22:31 · 1637 阅读 · 1 评论 -
Lucene 6.1.0 入门Demo
根据Lucene 6.1.0 及JDK 1.8最新版本,结合前几篇文章所写的最新Demo. 代码如下:package Demo;import java.io.File;import java.io.FileReader;import java.nio.file.FileSystems;import org.apache.lucene.analysis.Analyzer;import org原创 2016-08-05 10:16:15 · 11701 阅读 · 7 评论 -
Lucene 算法原理
Lucene的概述: Lucene(发音为 [‘lusen] )是一个非常优秀的开源的全文搜索引擎,我们可以在它的上面开发出各种全文搜索的应用来。Lucene在国外有很高的知名度,现在已经是Apache的顶级项目,在国内,Lucene的应用也越来越多。Lucene的算法原理: Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 0)设有两篇转载 2016-08-05 17:19:04 · 4258 阅读 · 0 评论 -
Lucene中文切分原理及其他常见切分算法
1、 什么是中文分词学过英文的都知道,英文是以单词为单位的,单词与单词之间以空格或者逗号句号隔开。而中文则以字为单位,字又组成词,字和词再组成句子。所以对于英文,我们可以简单以空格判断某个字符串是否为一个单词,比如I love China,love 和 China很容易被程序区分开来;但中文“我爱中国”就不 一样了,电脑不知道“中国”是一个词语还是“爱中”是一个词语。把中文的句子切分成有意义的词,就原创 2016-08-05 18:06:02 · 6641 阅读 · 0 评论