Lucene 3.6 contrib 学习总结

最新推荐文章于 2023-07-12 17:31:20 发布

weixin_33806914

最新推荐文章于 2023-07-12 17:31:20 发布

阅读量107

点赞数

文章标签：人工智能 java

原文链接：https://my.oschina.net/so1y/blog/54554

版权

为什么80%的码农都做不了架构师？>>>

analyzers : 各种分词器以国家、语言、功能进行分类

grouping ：分组统计，可以对各Field进行几个级别的搜索结果中field值的统计

highlighter ：高亮，搜索结果Document中的空间向量文本进行高性能高亮

icu：开始不知道它是干嘛呢，既然有分词的实现咋不放入 analyzers包中呢，详细的看后，http://site.icu-project.org/ 发现它的定义。提供标准国际化编码UTF-8支持。实用价值不大。

instantiated : 好像是实时搜索有关，从包名称中推里其内容为搜索对象初始化相关

join：连接时查询，看事例代码，主要突出父类、及子类 query 和同时包含 2者的查询，支持相互之间的查询时进行查询

memory：内存相关。只有一个类：MemoryIndex，实现序列化，官方介绍：高性能单文档主内存的全文检索和索引。实现简单在内存中索引、存储索引、查询、算法计算等，针对小数据量，但要求快速索引的可以选择

misc：其他相关项

pruning ：英文单词的google 翻译是修剪，是的，pruning是用来缩减lucene索引大小的。在readme中官方使用Static index pruning tools. 静态索引修剪工具来描述。在大索引的企业索引中也是蛮有用处的。

queries：解析 + || @ 等操作符封装为query 和相反的从query到查询公式字符串

queryparser：高一层的在搜索逻辑上封装 Query

remote：远程搜索，使用java RMI技术，没多大实用价值

spatial： geo地图中位置范围查询，基于将坐标转换为数值型进行范围查询,还有这模块将会在4.0中做较大更新,做geo搜索的创业型公司来说，这是件非常棒的事情

spellchecker：以前版本就有了，不过这次较多的提升了性能和准确率。这就是类google 搜索时，提示相关关键词功能的实现

xml-query-parser: 基于xml的query 和 query Parser，企业级索引服务用的比较多，实现方式不一这一种，索引多数企业是自己实现这块。

Lucene 3.6 更多的是提升性能。期待4.0,带来更多的搜索相关的新功能。

转载于:https://my.oschina.net/so1y/blog/54554

weixin_33806914

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。