solr&lucene
clamaa
这个作者很懒,什么都没留下…
展开
-
Solr-DIH建立索引并执行简单初步的查询
我们将solr的安装目录设置为$SOLR_INSTALL, ./solr start,不使用任何原有的examples来进行,启动完成后,不存在任何的core,提示No cores available。 在手动执行Add Core操作时,需要保证instanceDir和dataDir事先必须存在,以便能够建立目录成功。 根据错误提示,目录应该建立在$SOL...2016-05-04 13:40:31 · 107 阅读 · 0 评论 -
Solr在Linux中的产品化安装
目前服务器上安装的solr版本:5.3.1,不同于测试和研究,如果要把solr产品化部署,需要将其安装成一个服务。在solr压缩包中的bin/目录下有一个脚本文件**install_solr_service.sh**,负责solr的安装,并注册为自启动的service。 1. 环境准备首先需要创建一个solr用户,并赋予其相应的权限:groupadd zpsolruser...原创 2017-01-16 11:23:42 · 196 阅读 · 0 评论 -
一次压测情况下Solr部分性能调整
在将solr模糊词搜索从 copyfield方式修改为 qf(query function)之后,其query的性能降低不少。原来是采用将所有需要搜索的字段都copy至同一个字段中,最近要根据模糊匹配结果的权重分析,这种方式根本无法满足要求,所以就采用了query function,这样就能定义不同字段的权重了,例如我们qf可以如下定义: product_name^...原创 2016-10-20 08:50:15 · 733 阅读 · 0 评论 -
理解和学习Solr的score机制
参考:http://www.cnblogs.com/rcfeng/p/4067896.htmlhttp://www.cnblogs.com/forfuture1978/archive/2010/03/07/1680007.html 在solr的document文档定义中(schema.xml),需要对每个字段进行定义indexed, stored,其中表示的含义为: ...原创 2016-09-03 10:50:24 · 884 阅读 · 0 评论 -
Solr Web增加Basic安全性验证
Solr在5.0版本后,不再提供war包部署的方式,取而代之的是内置了jetty服务, 但是我们发现其中并没有内置任何安全性相关检查,任何人如果知道了我们的外网地址就能直接访问并修改其中的索引。经过查找可以使用jetty的方式来限制web访问。 solr/server/solr-webapp/WEB-INF/web.xml中增加以下字段: <sec...原创 2016-08-17 17:48:22 · 473 阅读 · 0 评论 -
Lucene 中的Tokenizer, TokenFilter学习
lucene中的TokenStream,TokenFilter之间关系 TokenStream是一个能够在被调用后产生语汇单元序列的类,其中有两个类型:Tokenizer和TokenFilter,两者的不同在于TokenFilter中包含了一个TokenStream作为input,该input仍然可以为一种TokenFilter进行递归封装,是一种组合模式;而Tokenzie...2016-06-15 10:03:29 · 454 阅读 · 0 评论 -
本地通过源码方式启动solr
首先,下载solr5.5.0源码,http://apache.fayea.com/lucene/solr/5.5.0/solr-5.5.0-src.tgz 解压完成后,分为几个目录,然而solr是通过ant编译的,我们想将其转换为maven方式,发现其中存在dev-tools/maven中,其中对应的说明: Copy the Maven POM templates ...2016-06-14 11:41:54 · 275 阅读 · 0 评论 -
Lucene根据字段进行自定义搜索扩展
最近需要对公司的产品搜索功能做一步改动,搜索到的结果首先按照是否有库存进行排序,然后再按照销量。由于库存量也是一个整数,如果直接按照库存量进行倒序排序的话,是不符合要求的,Lucene也没有支持我们这种特殊的业务需求,但是可以通过扩展的方式进行改写。 参考文档:http://blog.csdn.net/cctcc/article/details/45672247 publ...2016-05-13 09:16:14 · 178 阅读 · 0 评论 -
Solr Suggest组件的使用
使用suggest的原因,最主要就是相比于search速度快,In general, we need the autosuggest feature to satisfy two main requirements: ■ It must be fast; there are few things that are more annoying than a clunky type- ...2016-05-12 18:57:33 · 226 阅读 · 0 评论 -
Solr入门
由于现公司要强化一下搜索相关的功能,特对Solr及Lucene进行简要的研究,并做一些个人总结。 Solr采用Lucene搜索库为核心,提供全文索引和搜索的开源企业平台,提供REST的HTTP/XML和JSON的API。 Solr项目的英文主页:http://lucene.apache.org/solr/,其中介绍了Solr的基本情况:Solr is highly re...2016-04-06 21:15:59 · 128 阅读 · 0 评论