SOLR
文章平均质量分 69
thundersssss
专注于通用搜索引擎算法,垂直搜索引擎
展开
-
实战: SOLR的分布式部署(复制模式 CollectionDistribute)部署流程详解 (二)
<p class="MsoNormal" style="mso-margin-top-alt:auto;mso-margin-bottom-alt:auto;text-align:center;mso-pagination:widow-orphan;mso-outline-level:1" align="center"> <p class="MsoNormal" style="mso-原创 2009-12-29 15:39:00 · 5979 阅读 · 3 评论 -
通过对QParser类的继承 实现SOLR 半匹配检索(模糊搜索/模糊检索) (一)
在SOLR应用中,需要支持对指定关键词部分匹配的应用场景 如何实现SOLR的模糊检索(半匹配)? 何谓模糊检索(半匹配): 这种方式是生产环境下经常要使用到的检索方式,通过对命中请求关键词分词后的一个或多个词元的进行检索方式叫做半匹配或模糊匹配,(注意: 这里要与SOLR检索运算符“~” 检索方式区分开)。 如用户输入关键词:战争人,但是索引库里收录只有“战争之人”原创 2010-01-07 15:26:00 · 6224 阅读 · 5 评论 -
在SOLR环境变量的配置 过程中,遇到的 A pseudo attribute name is expected 异常
此类问题,不仅仅限于SOLR,还有很多基于XML配置程序,也会出现这种问题,原因十有八九就是 XML格式书写错误 有问题的XML : 大家不仔细看,很难看出XML书写的问题: 第一行倒数第二列少了个 “?” 正常应该是这样:原创 2010-03-17 11:45:00 · 8267 阅读 · 0 评论 -
SOLR环境变量的配置
solr.solr.home的理解和配置 主要有两种 基于环境变量solr.solr.home在当前用户的环境变量中(.bash_profile)或在/opt/tomcat/catalina.sh中添加如下环境变量export JAVA_OPTS="$JAVA_OPTS -Dsolr.solr.home=/opt/solr-tomcat/solr" 评价:原创 2010-03-17 11:37:00 · 3979 阅读 · 0 评论 -
如何使SOLR系统自动AUTO COMMIT?
在很多情况下,我们并不想自己主动触发COMMIT相应的XML给SOLR,这样带来很多的不便,恰好,SOLR通过配置文件可以自行在满足指定的条件下自动的COMMIT索引,同时,让前端检索实例可以检索到最新生成的数据,而不需要人为干预。 方法很简单:找到solrConfig.xml文件 找到以下行,并增加以下配置 1原创 2010-03-16 19:34:00 · 6242 阅读 · 0 评论 -
实战: SOLR的分布式部署(复制)CollectionDistribute 快照分发 (精简版)
SOLR复制模式,是一种在分布式环境下用于同步主从服务器的一种实现方式,因之前提到的基于rsync的SOLR不同方式部署成本过高,被SOLR1.4版本所替换,取而代之的就是基于HTTP协议的索引文件传输机制,该方式部署简单,只需配置一个文件即可。以下讲解具体操作步骤: 步骤分主服务器和从服务器,允许有多个从服务器,即从服务器的配置一样。主服务器:原创 2010-03-16 15:37:00 · 5524 阅读 · 2 评论 -
如何设置SOLR的高亮 (highlight)?
打开SOLR的核心配置文件: solrconfig.xml 找到 standard request handler 写入以下XML配置代码: explicit true title 3 <!--原创 2010-03-11 15:14:00 · 19281 阅读 · 10 评论 -
如何在SOLR中嵌入自己的分词系统??
SOLR虽然为我们提供了分词的接入方法,但很显然并不奏效,搜遍了大江南北,也没有什么可参考的,大部分都是使用的IK或庖丁之类的分词~~,难不成就这样永远活在别人的阴影中??答案是"NO!",如果是这样那就意味着屏蔽词管理,词典实时更新,实时持久化等多个个性化的产品需求得以在这些分词系统上半路杀入,老鸟应该都明白这种做法的成本是太高了。 SOLR推荐但失败的分词接入方法原创 2010-03-10 18:11:00 · 3591 阅读 · 0 评论 -
实战: SOLR的分布式部署(复制)CollectionDistribute 快照分发 (一)
网上有很多SOLR的文章,但是大多都是翻译自SOLR的官方WIKI,尤其是对分布式说的较含糊,在部署过程中,出现很多问题,令人摸不着头脑,下面就有些我遇到的情况及解决方案作下描述,希望对大家有用。 SOLR复制模式下分布式应用的基本原理: SOLR主要通过SHELL脚本与SOLR的相互协调完成快照在主服务器与辅服务器下的同步完成,该脚本位于:SOLR的安原创 2009-12-29 12:25:00 · 2507 阅读 · 0 评论 -
如何启动SOLR特性: 按层面检索?
按层面检索是SOLR推出的一项特性,可以再检索结果中按照事先设定的分类,标签等显示,目前已经有很多搜索引擎提供这项功能,现将SOLR的实现步骤展示给大家: 首先在配置之前,需要将自己的分类,或标签等将要按照层面检索的字段,设置为索引,存储格式,并已创建索引。 找到SOLR的核心配置文件: solrconfig.xml原创 2010-03-11 14:56:00 · 2307 阅读 · 0 评论 -
使用memcached缓存 替代solr中的LRUCache缓存
前沿 在搜索引擎中,缓存被当做是不可缺少的部分,但是很多情况下,将缓存的实现过度依赖于分发服务器及webserver会很大程度上加重webserver的负担,具体表现就是经常性的假死,拒绝服务,因此为了解放前端转发服务器,我们将使用solr + memcache后端搭档组合实现缓存。 前期准备条件:点击下面的下载地址,将memcache必备的工具包和java类下载至本地原创 2010-05-25 19:15:00 · 3702 阅读 · 3 评论