读《Ajax+Lucene构建搜索引擎》后的感想

 早就借了这本书,经过了半年的时间,今天终于得空把这种书浏览了一下。首先总体评价一下:内容已经过时了。

想当年好像用到过本书的一个google suggest的例子,但最终由于中文问题被搁置了。看了后面的lucene我的收获:

one;调整性能参数。

1,mergeFactor。

它用于控制mergeFactor写入磁盘上的文件系统的最大Document数量,同时控制内存中Segement的最大数量。

2,maxMergeDocs。

限制一个Segement中的最大数量,即到达这个数量之后就不能继续合并了

3,minMergeDocs。

很少用。

two;限制Field长度。

maxFieldLength()

限制索引文档的term数量。

three;从索引中删除文档。

用到IndexReader工具。For example reader.delete()。

Forth;对各种分词的了解。

lucene内置的StandardAnalyzer,SimpleAnalyzer等还有cjkanalyzer以及中科院分词。

Five;lucene SendBox。

www.getopt.org/luke 上面下载luke源代码,eclipse导入后,随便玩

http://limo.sourceforge.net/上下载limowar包放到tomcat主目录下的webapp目录下,然后输入http://localhost:8080/limo进入后随便玩。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值