搜索引擎--lucene
iteye_17106
这个作者很懒,什么都没留下…
展开
-
搜索引擎--Lucene简介
Apache Lucene is a high-performance, full-featured text search engine library written entirely in Java. It is a technology suitable for nearly any application that requires full-text search, espec...2008-04-15 09:41:57 · 97 阅读 · 0 评论 -
Lucene 索引文件结构分析
首先理解反向索引(Inverted index)这个概念,反向索引是一种以索引项为中心来组织文档的方式,每个索引项指向一个文档序列,这个序列中的文档都包含该索引项。相反,在正向索引中,文档占据了中心的位置,每个文档指向了一个它所包含的索引项的序列。你可以利用反向索引轻松的找到那些文档包含了特定的索引项。Lucene正是使用了反向索引作为其基本的索引结构。索引文件的逻辑视图在Lu...2008-04-27 17:25:53 · 228 阅读 · 0 评论 -
lucene 漫谈--入门与介绍(6)
[b]8 分析器[/b] 在前面的概念介绍中我们已经知道了分析器的作用,就是把句子按照语义切分成一个个词语。英文切分已经有了很成熟的分析器: StandardAnalyzer,很多情况下StandardAnalyzer是个不错的选择。甚至你会发现StandardAnalyzer也能对中文进行分词。 但是我们的焦点是中文分词,StandardAnalyze...2008-04-25 17:18:38 · 87 阅读 · 0 评论 -
lucene 漫谈--入门与介绍(5)
[b]7 如何搜索[/b] lucene的搜索相当强大,它提供了很多辅助查询类,每个类都继承自Query类,各自完成一种特殊的查询,你可以像搭积木一样将它们任意组合使用,完成一些复杂操作;另外lucene还提供了Sort类对结果进行排序,提供了Filter类对查询条件进行限制。你或许会不自觉地拿它跟SQL语句进行比较:“lucene能执行and、or、order by、whe...2008-04-25 17:06:50 · 95 阅读 · 0 评论 -
lucene 漫谈--入门与介绍(4)
[b]5 如何建索引[/b] 5.1 最简单的能完成索引的代码片断[code="java"] IndexWriter writer = new IndexWriter(“/data/index/”, new StandardAnalyzer(), true); Document doc = new D...2008-04-25 17:03:14 · 78 阅读 · 0 评论 -
lucene 漫谈--入门与介绍(3)
[b]4 lucene的结构[/b] lucene包括core和sandbox两部分,其中core是lucene稳定的核心部分,sandbox包含了一些附加功能,例如highlighter、各种分析器。 Lucene core有七个包:analysis,document,index,queryParser,search,store,util。...2008-04-25 16:58:19 · 124 阅读 · 0 评论 -
lucene 漫谈--入门与介绍(2)
[b]3lucene的几个重要概念[/b] lucene用到一些概念,了解它们的含义,有利于下面的讲解。 3.1 analyzer Analyzer是分析器,它的作用是把一个字符串按某种规则划分成一个个词语,并去除其中的无效词语,这里说的无效词语是指英文中的“of”、 “the”,中文中的“的”、“地”等词语,这些词语在文章中大量出现,...2008-04-25 16:52:16 · 96 阅读 · 0 评论 -
lucene 漫谈--入门与介绍(1)
[b]1 lucene简介[/b] 1.1 什么是lucene Apache Lucene是一个基于Java全文搜索引擎,利用它可以轻易地为Java软件加入全文搜寻功能。 Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。可以方便的嵌入到各种应用中...2008-04-25 16:49:34 · 92 阅读 · 0 评论 -
Lucene 学习笔记
[b]Apache Lucene is a high-performance, full-featured text search engine library. [/b]1.[b]Here's a simple example how to use Lucene for indexing and searching[/b] (using JUnit to check if the res...2008-04-16 13:09:16 · 70 阅读 · 0 评论 -
Lucene 入门与实战
[quote]本文转载自:[url]http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/#N1004B[/url]关于作者 周登朋,软件工程师,上海交通大学研究生,对 Java 技术以及信息检索技术很感兴趣。您可以通过 zhoudengpeng@yahoo.com.cn 与他联系。 本文首先介绍了Lucene的一些基...2008-04-15 11:18:33 · 65 阅读 · 0 评论 -
搜索引擎--Lucene学习资料
搜索引擎--Lucene学习资料 1、实战 Lucene,第 1 部分: 初识 Lucene [url]http://wishlife.iteye.com/blog/182832[/url] 2、Lucene:基于Java的全文检索引擎简介 [url] http://www.chedong.com/tech/lucene.html#intro[/url]...2008-04-15 11:14:55 · 98 阅读 · 0 评论 -
Lucene索引文件格式分析
Lucene的文件格式的规范,其规定了Lucene的文件格式采取的存储单位、组织结构、命名规范等等内容.在Lucene的文件格式中,以字节为基础,并且定义了自身的数据类型.由于它们都以字节为基础定义而来,因此保证了是平台无关,这也是Lucene索引文件格式平台无关的主要原因.Lucene索引被处理为一个目录(文件夹),其中含有的所有文件即为其内容,这些文件按照所属的段不同分组存放,...2008-04-30 23:04:25 · 76 阅读 · 0 评论