Lucene
绝地反击T
世界那么大,我想去看看。
展开
-
LUCENE 3.6 学习笔记
目前,主流的全文索引工具有:Lucene , Sphinx , Solr , ElasticSearch。其中Solr和Elastic Search都是基于Lucene的。Sphinx不是 apache的项目,如果你想把Sphinx放到某个商业性的项目中,你就得买个商业许可证。 此文章为个人学习备忘之用,仅适合lucene的初学者参考阅读。至于lucene能做什么,自己百度就转载 2014-10-27 21:50:38 · 1623 阅读 · 0 评论 -
Lucene:全文检索的基本原理
一、总论 根据http://lucene.apache.org/java/docs/index.html 定义: Lucene 是一个高效的,基于Java 的全文检索库。 所以在了解Lucene之前要费一番工夫了解一下全文检索。 那么什么叫做全文检索呢?这要从我们生活中的数据说起。 我们生活中的数据总体分为两种:结构化数据 和非结构化数据 。 结构化数据: 指具有固定格式或有限长度的转载 2014-10-21 22:07:50 · 614 阅读 · 0 评论 -
Lucene的一个简单的标准测试(Lucene包基于3.5版本的)
Lucene编程一般分为:索引、分词、搜索 索引源代码: package lucene的一个标准测试; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.IOException; import java.io.InputStreamReader;原创 2015-03-22 09:39:29 · 1225 阅读 · 0 评论 -
LuceneDemo类的演示案例:建立索引、建立搜索,另外建立一个测试类TestLucene(用到JUnit)
LuceneDemo类的演示案例:建立索引、建立搜索(需要Lucene包3.5版本) package test; import java.io.File; import java.io.FileReader; import java.io.IOException; import org.apache.lucene.analysis.standard.StandardAnalyzer; imp原创 2015-03-22 12:01:29 · 759 阅读 · 1 评论 -
Lucene中的域存储,分析及索引建立步骤
Field.Store.YES或者NO(存储域选项) 设置为YES表示把这个域中的内容完全存储到文件中,方便进行文本的还原。 设置为NO表示把这个域的内容不存储到文件中,但是可以被索引,此时内容无法完全还原(doc.get) Field.Index(索引选项) Index.ANALYZED:进行分词和索引,适用于标题、内容等。 Index.NOT_ANALYZED:进行索引,但是原创 2015-03-24 17:20:20 · 1081 阅读 · 0 评论 -
全文检索的基本原理之Lucene原理篇
一、总论 根据 http://lucene.apache.org/java/docs/index.html定义: Lucene是一个高效的,基于Java的全文检索库。 所以在了解Lucene之前要费一番工夫了解一下全文检索。那么什么叫做全文检索呢?这要从我们生活中的数据说起。我们生活中的数据总体分为两种:结构化数据和非结构化数据。 结构化数据:指具有固定格式或有限长度的数转载 2015-07-28 12:01:40 · 617 阅读 · 0 评论 -
全文检索的基本原理之Lucene原理篇
一、总论 根据 http://lucene.apache.org/java/docs/index.html定义: Lucene是一个高效的,基于Java的全文检索库。 所以在了解Lucene之前要费一番工夫了解一下全文检索。那么什么叫做全文检索呢?这要从我们生活中的数据说起。我们生活中的数据总体分为两种:结构化数据和非结构化数据。 结构化数据:指具有固定格式或有限长度的数转载 2015-07-28 12:03:29 · 629 阅读 · 0 评论