Apache Lucene Java 全文检索引擎架构
Apache Lucene 8.9.0 已发布,Lucene 是完全用 Java 编写的高性能、功能齐全的全文检索引擎架构,提供了完整的查询引擎和索引引擎、部分文本分析引擎。目的是为软件开发人员提供一个简单易用的工具包,以方便地在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。
发布公告显示,此版本修复了许多错误,同时包含其他的功能优化和改进。
- SortedSet DocValues 添加了压缩功能,可以显着减少它们在磁盘上的占用体积
- BM25FQuery 被扩展为处理 BM25Similarity 之外的相似性。它被重命名为 CombinedFieldQuery 以反映其更通用的范围
- 添加了新的 PatternTypingFilter 以允许基于一组已配置的正则表达式在 token 上设置类型属性
- 添加了一个选项来为 IndexWriter 和 DirectoryReader 提供自定义叶排序器,它允许使用提供的 sort criteria 加速排序查询