本次发布的Lucene 2.9.0仍然兼容早期Lucene版本,并重构了大量API,在很多功能上进行了增强:
Lucene 2.9.0增加了分段搜索和缓存
Lucene 2.9.0在IndexWriter中加入了接近实时搜索的能力。
Lucene 2.9.0引入了新的Query类型
Lucene 2.9.0引入了更加智能和灵活的多词期查询(通配符查询和范围查询)
Lucene 2.9.0引入了新的经过优化的控制器和评分器API
Lucene 2.9.0增强了对Unicode的支持和新的排序功能
Lucene 2.9.0新增了TokenStreamAPI的属性
Lucene 2.9.0新增了一个新的QueryParser框架。
Lucene 2.9.0中通过字段排序时评分功能将是可选择的。
Lucene 2.9.0增加了新的分析器,包括:PersianAnalyzer, ArabicAnalyzer, SmartChineseAnalyzer (最后这个是智能中文分析器)
Lucene 2.9.0中新增了快速向量高亮处理大文档的方法
Lucene 2.9.0支持高性能的数字域的处理,而不像以前版本那样需要转为文本存储
我不会Java,不过现学现用,折腾一下。写一个简单的学习系列笔记。
主要是索引过程和搜索过程
不过重要的是分析一下数字搜索和实时搜索的原理和效果