Lucene
文章平均质量分 85
lujianing2011
这个作者很懒,什么都没留下…
展开
-
Lucene 基本概念
首先、要做一个自己的企业内部搜素引擎呢,要认识Lucene:1、Lucene的贡献者Doug Cutting是一位自身全文索引/检索专家,曾经是V-Twin搜索引擎(Apple的Copland操作系统的成就之一)的主要开发者,后在Excite担任高级系统架构设计师,目前从事于一些INTERNET底层架构的研究。他贡献出的Lucene的目标是为各种中小型应用程序加入全文检索功能。2001年年转载 2013-03-21 13:06:53 · 782 阅读 · 0 评论 -
Lucene 分词
分词的基本原理:1、分词是用来对文本按语言特征按算法进行过滤、分组处理的一种技术。2、分词的对象是文本,而不是图像动画脚本等等。3、分词的方式就是过滤和分组。4、过滤主要把文本中那些没有实际意义的字或词过滤掉。5、分组就是按照”分词数据库“内已添加好的词,进行匹配。下面来看Lucene分词器的使用[java] view转载 2013-03-21 13:16:12 · 893 阅读 · 0 评论 -
Lucene 搜索
Lucene的常用检索类1、IndexSercher:检索操作的核心组件,用于对IndexWriter创建的索引执行,只读的检索操作,工作模式为接受Query对象而返回ScoreDoc对象。2、Term:检索的基本单元,标示检索的字段名称和检索对象的值,如Term("title", "lucene")。即表示在title字段中搜索关键词lucene。3、Query:表示查询转载 2013-03-21 13:13:25 · 10853 阅读 · 0 评论 -
Lucene 索引
Lucene的核心索引类:1、IndexWriter:建立索引的核心组件。2、Directory:代表一个lucene索引项的位置。3、Analyzer:对文本内容进行分析的抽象类,具体实现中有停用词切除 、词干分析、大小写切换等功能。4、Document:可以视作文本经过处理后所对应的对象,由多个字段组成 ,如路径、标题、摘要、修改日期等等。5、Field转载 2013-03-21 13:09:18 · 642 阅读 · 0 评论 -
Lucene 搜索二
Lucene分页搜索的实现:[java] view plaincopypackage com.qianyan.lucene; import java.io.IOException; import org.apache.lucene.document.Document; import org.apache.lu转载 2013-03-21 13:14:18 · 612 阅读 · 0 评论