Lucene
shuishi0
这个作者很懒,什么都没留下…
展开
-
Doug Cutting (Lucene-Nutch-Hadoop 创始人简介)
吃水不忘挖井人,介绍Doug Cutting大牛是十分有必要的。 最早,接触到搜索引擎,知道有个Nutch(开源搜索引擎),于是开始查看Nutch相关的资料,发现了Nutch的创始人Doug Cutting,随着项目的深入,发现Doug Cutting本人不仅是Nutch的创始人,还是Lucene(开源的全文检索包)项目的创始人,之后Doug Cutting加入Yahoo,06年成...原创 2010-08-24 15:22:16 · 201 阅读 · 0 评论 -
lucene 搜索最新添加索引
在应用中很多时候,我们都是将IndexWriter 和 IndexSearch做成单例模式,这时会出现一种现象:即使IndexWriter.commit(),在IndexSearch查找依然查找不到最新添加的索引,这是因为IndexRead没有重新打开的问题,解决方法(关闭IndexSearch,再重新打开:)[img]http://dl.iteye.com/upload/attachme...原创 2010-08-29 14:37:05 · 110 阅读 · 0 评论 -
Lucene 基本原理
Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 0)设有两篇文章1和2 文章1的内容为:Tom lives in Guangzhou,I live in Guangzhou too. 文章2的内容为:He once lived in Shanghai. 1)由于lucene是基于关键词索引和查询的,首先我们要取得这...原创 2010-09-11 17:16:49 · 100 阅读 · 0 评论 -
Lucene中文件格式介绍
Lucene中索引文件有许多种,不同类型的文件存储的不同的信息,分别如下:正向信息:1.段的元数据信息a. segments :为索引的段文件命名,它的数据格式中包括下一个段的名称b. segments.gen : 为生成的引用文件名命名2.域数据信息a. fnm :域的元数据b. fdt :域数据信息c. fdx :域索引数据3. 词数据信息a. ...原创 2010-09-27 15:00:01 · 176 阅读 · 0 评论