lucene
jayson118
普普通通
展开
-
lucene6.6+拼音分词+ik分词实现
原来项目使用的是solr进行建立索引与查询,最近想改为lucene。对于最新版的lucene网上的资料没有solr多,并且solr很多功能直接配置就可以使用,但是lucene都要通过api进行封装使用。下面是自己使用lucene6.6+拼音分词和ik中文分词实现的功能:主要工具包:lucene6.6相关jar包pinyinAnalyzer.jarik-analyzer-so原创 2017-09-27 15:23:57 · 2740 阅读 · 0 评论 -
lucene UnifiedHighlighter高亮组件
在使用solr的时候,默认的高亮方法使用的是hl.method=original。solr6.4以后出现了一个新的高亮方法unifield,可以直接设置hl.method=unified。官方说法推荐使用这个高亮方法,更加灵活可以支持各类查询。在lucene底层这个方法对应的对象就是这个UnifiedHighlighter,但是没有看到关于这个类的使用方法,自己也不是很看懂api的介绍,试了一下用原创 2017-10-12 17:45:21 · 863 阅读 · 0 评论 -
lucene索引文件检测CheckIndex
lucene索引文件有可能由于各种原因导致损坏,所以对索引文件定期进行检测和备份是很有必要的,不然等问题真的暴露出来后往往不好解决。lucene提供了检测索引文件的工具类:CheckIndex在控制台可以使用如下命令得到检测结果:C:\Users\Administrator>java -cp f://lucene-core-6.6.0.jar -ea:org.apache.lucene原创 2017-10-13 17:29:13 · 2584 阅读 · 0 评论 -
lucene6.0+数值型字段排序与范围查询
在使用lucene进行建立索引搜索时,排序与范围查询常会使用到数值型字段,int、long、float等,lucene在6.0版本后很多老的api被删除,启用了很多新的处理api,对于数值型字段多了新的处理,原来lucene对于数值型字段还是相对较弱的。lucene主要是采用倒排索引的形式进行建立索引进行查询的,通过term到doc映射达到快速索引的目的,但是在排序、高亮、统计时这种方式也并不高效...原创 2018-04-13 20:09:48 · 1650 阅读 · 1 评论