lucene
帅气的东哥
这个作者很懒,什么都没留下…
展开
-
lucene2.9的改进
Lucene 2.9的大部分重心放在了性能优化方面,这体现在从低端的内部基础结构改进到索引管理方式等多个方面。Lucene的索引数据库由一系列分离的“片断”组成,每个片段存放在独立的文件中。当你向索引中添加文档时,便会不断创建一些可以合并的新片断。Lucene会在FieldCache中缓存字段信息,不过在Lucene 2.4以及之前的版本中,加载字段缓存的开销相对较高,尤其在2.4版本中还会不断重转载 2013-04-05 16:36:01 · 1412 阅读 · 0 评论 -
lucene索引文件的格式(2)
本文转载自http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623599.html请支持原创!!!四、具体格式上面曾经交代过,Lucene保存了从Index到Segment到Document到Field一直到Term的正向信息,也包括了从Term到Document映射的反向信息,还有其他一些Lucene特有的信息。转载 2013-04-06 14:17:09 · 1775 阅读 · 0 评论 -
lucene的索引文件的格式(1)
本文转载自http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623597.html支持原创!!!Lucene的索引里面存了些什么,如何存放的,也即Lucene的索引文件格式,是读懂Lucene源代码的一把钥匙。当我们真正进入到Lucene源代码之中的时候,我们会发现:Lucene的索引过程,就是按照全文转载 2013-04-06 14:20:46 · 1287 阅读 · 0 评论 -
lucene的总体架构
本文转载自http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623596.htmllucene总的来说是:一个高效的,可扩展的,全文检索库。全部用Java实现,无须配置。仅支持纯文本文件的索引(Indexing)和搜索(Search)。不负责由其他格式的文件抽取纯文本文件,或从网络中抓取文件的过程。在Lucen转载 2013-04-06 14:22:50 · 1490 阅读 · 0 评论 -
全文检索的基本原理
本文转载自http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623594.html一、总论根据http://lucene.apache.org/java/docs/index.html定义:Lucene是一个高效的,基于Java的全文检索库。所以在了解Lucene之前要费一番工夫了解一下全文检索。那么什么叫做全文检转载 2013-04-06 14:25:03 · 1462 阅读 · 0 评论 -
lukeall的下载与使用
Lukeall的下载与使用具体的步骤已经在我的一个文档中有详细说明,请参照即可(因为不会再csdn中贴照片,所以就以文档资源的形式上传了)原创 2013-04-06 22:21:56 · 2434 阅读 · 0 评论 -
Lucene全文搜索框架
1 lucene简介1.1 什么是luceneLucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。1.2 lucene能做什么要回答这个问题,先要了解lucene的本质。实际上lucene的功能很单一,说到底,就是你给它若干个字符串,然后它为转载 2013-04-18 22:50:02 · 1633 阅读 · 0 评论