搜索
PolarisHuster
java程序员,爱编程爱运动,也喜欢结交朋友
展开
-
lockFactory=org.apache.lucene.store.NativeFSLockFactory still has pending deleted files;
在windows上使用lucene,欲执行下面的操作:1.删除所有索引 2.创建索引结果出现了上面的问题Directory MMapDirectory lockFactory=org.apache.lucene.store.NativeFSLockFactory still has pending deleted files;; cannot initialize IndexWriter,出现这个...原创 2018-03-22 14:20:12 · 1338 阅读 · 0 评论 -
lucene如何返回所有数据
我们在实际使用lucene的过程中,筛选多个条件时BooleanQuery这个类来实现,比如下面代码: BooleanQuery.Builder bqBuilder = new BooleanQuery.Builder(); if(!StringUtils.isEmpty(name)){ SmartChineseAnalyzer analyzer=new SmartChineseAn...原创 2018-03-08 14:37:52 · 3344 阅读 · 2 评论 -
lucene6 搜索按照字符串字段排序
lucene6 搜索按照字符串字段排序 lucene 字符串字段排序原创 2017-03-21 08:28:02 · 1889 阅读 · 0 评论 -
可用来抓数据的开源爬虫软件工具
可用来抓数据的开源爬虫软件工具转载 2017-03-17 08:29:19 · 2464 阅读 · 0 评论 -
lucene6 IntPoint
lucene6 IntPoint lucene6 整形存储 排序原创 2017-03-17 08:19:29 · 3246 阅读 · 0 评论 -
lucene6按照整形数据排序搜索结果
lucene6按照整形数据排序搜索结果原创 2017-03-16 19:32:14 · 1561 阅读 · 0 评论 -
lucene6之TextField与StringField对比
lucene6之TextField与StringField对比原创 2017-03-16 17:01:58 · 7933 阅读 · 1 评论 -
Could not load codec 'Lucene54'. Did you forget to add lucene-backward-codecs.jar?
Could not load codec 'Lucene54'. Did you forget to add lucene-backward-codecs.jar?原创 2017-03-15 18:15:18 · 3354 阅读 · 0 评论 -
solr合并索引
solr下可以通过mergeindexes命令完成一个或多个core到其他core的索引合并,合并索引需要保证要被合并到的core的schema要与其他来源core的schema兼容,否则就会出现无法启动core的问题,我们可以通过代码CoreAdminRequest.MergeIndexes类实现,实例代码如下: try(SolrClient client = new Http...原创 2019-01-08 18:32:01 · 1315 阅读 · 0 评论 -
solr docvalues类型
在Lucene4.x之后,出现一个重大的特性,就是索引支持DocValues,DocValues是通过牺牲一定的磁盘空间带来的好处主要有两个(即以空间换时间),该特性有以下两个主要优点:(1)节省内存 (2)对排序,分组和一些聚合操作时能够大大提升性能 下面来详细介绍下DocValue的原理和使用场景 什么是docValues? docValues其实是Lucene在构建索引时,会额外...原创 2019-01-07 17:11:34 · 887 阅读 · 0 评论 -
SolrQuery VS QueryRequest
solrj是一款开源的访问solr服务器的三方插件,通过这个插件,我们可以完成solr admin页面能够完成以及不能完成的操作,查询作为solr的一个使用频率最高的操作当然也是使用最广的,使用solrj实现查询操作,基本上离不开下面几个类:SolrClient、SolrQuery以及QueryRequest,solrclient使用下面两个类型参数的方法: public final Nam...原创 2019-01-07 11:01:11 · 784 阅读 · 0 评论 -
solr之positionIncrementGap
positionIncrementGap这个特性针对multiValue字段使用,用于设置多值数据间的间隔,常见用法如下: <fieldType name="text_general_pos0" class="solr.TextField" positionIncrementGap="100"> <analyzer type="index">原创 2019-01-02 08:53:54 · 1549 阅读 · 0 评论 -
tika或pdf基础信息
通过下面的代码就可以获取一个pdf文件的基础信息: try{ BodyContentHandler handler = new BodyContentHandler(); Metadata metadata = new Metadata(); FileInputStream inputstream...原创 2018-12-24 09:09:48 · 348 阅读 · 0 评论 -
Caused by: java.lang.ClassNotFoundException: solr.extraction.ExtractingRequestHandler
Caused by: java.lang.ClassNotFoundException: solr.extraction.ExtractingRequestHandler原创 2017-04-07 12:59:35 · 2142 阅读 · 0 评论 -
tomcat8部署solr6.4.2
tomcat8部署solr6.4.2 tomcat8部署solr6返回403错误原创 2017-03-22 19:28:22 · 959 阅读 · 0 评论 -
Solr术语介绍:SolrCloud,单机Solr,Collection,Shard,Replica,Core之间的关系
Solr术语介绍:SolrCloud,单机Solr,Collection,Shard,Replica,Core之间的关系转载 2017-11-11 13:32:32 · 808 阅读 · 0 评论 -
上传solrcloud的配置文件到zookeeper
具体可以参考这篇文章:https://lucene.apache.org/solr/guide/6_6/command-line-utilities.html#CommandLineUtilities-Uploadaconfigurationdirectorysolr以集群模式工作时,通常选用zookeeper作为协调器,也需要把集群用到的配置文件上传到zookeeper上,如下图所示:这样当so...原创 2018-02-28 16:29:29 · 5489 阅读 · 1 评论 -
solr analysis页面分析
当我们搭建好solr环境时就可以看到如下界面:我搭建的是solr集群模式,并创建了collection1以及banks两个collection,该collection有两个shard,每个shard有一个副本,这样当其中一个shard所在solr服务器挂掉时,仍然不影响查询!(PS:创建collection命令:http://localhost:8180/solr/admin/collection...原创 2018-03-01 10:03:34 · 1860 阅读 · 0 评论 -
solrcloud删除active状态的shard
solr工作在集群模式下时,一般很难在开始阶段就能确定需要创建几个分片,只有当数据量大到一定的程度时(比如创建索引速度明显下降),这时我们可能就需要执行分片操作,但是有时我们有需要删除多余的shard,前提是这些shard有备份,否则可能导致数据缺失,但是我们是不能通过删除当前处于active状态的shard的(会报错),笔者在这里给出一种解决方法:把该shard上对应的备份删除即可http://...原创 2018-03-01 16:34:22 · 1147 阅读 · 0 评论 -
Solr-7.2.1配置Smartcn分词
转载自:https://www.jianshu.com/p/f3e8ecee932f1. 复制smartcn的jar包将solr_root/contrib/analysis-extras/lucene-libs/lucene-analyzers-smartcn-7.2.1.jar复制到solr_root/server/solr-webapp/webapp/WEB-INF/lib/2. ...转载 2018-12-01 20:19:00 · 713 阅读 · 0 评论 -
solr synonyms.txt不支持输入中文
为了实现实际使用中有些简称的准确匹配,这个时候我们就需要定义一些同义词,具体做法就是在solr自带的synonyms.txt文件中填写我们想要的缩写与全称对应关系:配置完成后需要重启solr 对应core,如下图所示:reload solr core时提示org.apache.solr.common.SolrException: Could not load conf for...原创 2018-12-07 16:55:16 · 812 阅读 · 0 评论 -
Solr的TrieField范围查询分析
转载自:http://jm.taobao.org/2012/05/05/solar-triefield-analyse/solr从1.4版本开始,提供了一种字段类型TrieField(TrieLongField、TrieIntField等),用于范围查询,性能比普通的数值类型要快10倍。为什么会快那么多呢?网上找不到相关资料,通过分析源代码,大概了解了其原理,给大家分享下。TrieFiel...转载 2018-12-07 15:55:20 · 912 阅读 · 0 评论 -
Solr6.2.1环境搭建
Solr6.2.1环境搭建转载 2017-03-22 09:37:16 · 608 阅读 · 0 评论