Lucene
绝地反击T
世界那么大,我想去看看。
展开
-
LUCENE 3.6 学习笔记
目前,主流的全文索引工具有:Lucene , Sphinx , Solr , ElasticSearch。其中Solr和Elastic Search都是基于Lucene的。Sphinx不是 apache的项目,如果你想把Sphinx放到某个商业性的项目中,你就得买个商业许可证。 此文章为个人学习备忘之用,仅适合lucene的初学者参考阅读。至于lucene能做什么,自己百度就转载 2014-10-27 21:50:38 · 1637 阅读 · 0 评论 -
Lucene:全文检索的基本原理
一、总论根据http://lucene.apache.org/java/docs/index.html 定义:Lucene 是一个高效的,基于Java 的全文检索库。 所以在了解Lucene之前要费一番工夫了解一下全文检索。那么什么叫做全文检索呢?这要从我们生活中的数据说起。我们生活中的数据总体分为两种:结构化数据 和非结构化数据 。结构化数据: 指具有固定格式或有限长度的转载 2014-10-21 22:07:50 · 620 阅读 · 0 评论 -
Lucene的一个简单的标准测试(Lucene包基于3.5版本的)
Lucene编程一般分为:索引、分词、搜索索引源代码:package lucene的一个标准测试;import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.IOException;import java.io.InputStreamReader;原创 2015-03-22 09:39:29 · 1236 阅读 · 0 评论 -
LuceneDemo类的演示案例:建立索引、建立搜索,另外建立一个测试类TestLucene(用到JUnit)
LuceneDemo类的演示案例:建立索引、建立搜索(需要Lucene包3.5版本)package test;import java.io.File;import java.io.FileReader;import java.io.IOException;import org.apache.lucene.analysis.standard.StandardAnalyzer;imp原创 2015-03-22 12:01:29 · 768 阅读 · 1 评论 -
Lucene中的域存储,分析及索引建立步骤
Field.Store.YES或者NO(存储域选项)设置为YES表示把这个域中的内容完全存储到文件中,方便进行文本的还原。设置为NO表示把这个域的内容不存储到文件中,但是可以被索引,此时内容无法完全还原(doc.get)Field.Index(索引选项)Index.ANALYZED:进行分词和索引,适用于标题、内容等。Index.NOT_ANALYZED:进行索引,但是原创 2015-03-24 17:20:20 · 1084 阅读 · 0 评论 -
全文检索的基本原理之Lucene原理篇
一、总论 根据 http://lucene.apache.org/java/docs/index.html定义:Lucene是一个高效的,基于Java的全文检索库。所以在了解Lucene之前要费一番工夫了解一下全文检索。那么什么叫做全文检索呢?这要从我们生活中的数据说起。我们生活中的数据总体分为两种:结构化数据和非结构化数据。 结构化数据:指具有固定格式或有限长度的数转载 2015-07-28 12:01:40 · 621 阅读 · 0 评论 -
全文检索的基本原理之Lucene原理篇
一、总论 根据 http://lucene.apache.org/java/docs/index.html定义:Lucene是一个高效的,基于Java的全文检索库。所以在了解Lucene之前要费一番工夫了解一下全文检索。那么什么叫做全文检索呢?这要从我们生活中的数据说起。我们生活中的数据总体分为两种:结构化数据和非结构化数据。 结构化数据:指具有固定格式或有限长度的数转载 2015-07-28 12:03:29 · 637 阅读 · 0 评论