Lucene
文章平均质量分 87
nyhing
这个作者很懒,什么都没留下…
展开
-
lucene全文检索应用示例及代码简析
Lucene是apache软件基金会 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包及架构,提供了完整的查询引擎和索引引擎,实现了一些通用的分词算法,预留很多词法分析器接口。本文以myrss.easyjf.com网站系统中使用Lucene实现全文检索的代码为例,简单演示Lucene在实际项目中的应用。 使用Lucene实现全文检索,主要有下面三个步骤: 1、建立索引...原创 2009-06-19 16:15:54 · 117 阅读 · 0 评论 -
倒排索引,反向索引,Inverted index
倒排索引(英语:Inverted index),也常被称为反向索引、置入档案或反向档案,是一种索引方法,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。它是文档检索系统中最常用的数据结构。 有两种不同的反向索引形式: 一条记录的水平反向索引(或者反向档案索引)包含每个引用单词的文档的列表。 一个单词的水平反向索引(或者完全反向索引)又包含每个单...原创 2009-06-19 17:54:45 · 629 阅读 · 0 评论 -
lucene中的组合查询
新版中使用: TermQuery tq1 = ……; TermQuery tq2 = ……; BooleanQuery bq = new BooleanQuery(); bq.add(tq1, BooleanClause.Occur.MUST); bq.add(tq2, BooleanClause.Occur.MUST); 旧版中使用: ...2009-06-25 13:23:04 · 137 阅读 · 0 评论 -
Lucene关于几种中文分词的总结
前提:文章基于lucene2.2。目前最新版本的lucene自身提供的StandardAnalyzer已经具备中文分词的功能,但是不一定能够满足大多数应用的需要。另外网友谈的比较多的中文分词器还有:CJKAnalyzerChineseAnalyzerIK_CAnalyzer(MIK_CAnalyzer)还有一些热心网友自己写的比较不错的分词器在此就不说了,有兴趣的可以自己研究研究。以上三个中文分词...原创 2009-06-25 17:22:32 · 65 阅读 · 0 评论 -
lucene的多种搜索
lucene的搜索相当强大,它提供了很多辅助查询类,各自完成一种特殊的查询,也可以相互组合使用,来完成一些复杂的操作. public class Test...{ Analyzer analyzer = new StandardAnalyzer(); RAMDirectory directory = new RAMD...原创 2009-06-28 10:33:04 · 71 阅读 · 0 评论 -
lucene多种搜索方式详解例子
import java.io.StringReader; import java.util.Date; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.SimpleAnalyzer; import org.apache.lucene.analysis.TokenStr...原创 2009-06-28 10:34:09 · 65 阅读 · 0 评论