Solr
熊猫家族
敢想,敢拼,敢赢,IT技术,研发实践,互联网,资讯,编程语言,搜索引擎,Lucene,Solr,Java,生活,旅游,吃货,熊猫吃货,微生活,健康,美食
展开
-
solr1.4 中文 庖丁 使用方法
由于solr1.4使用Lucene 2.9.1 ,故需要修改庖丁源代码:net.paoding.analysis.analyzer.PaodingTokenizer需要注意的有两点1. 继承关系由 TokenStream 调整为 Tokenizer,因此需要删除变量private final Reader input;删除对应的关闭方法public void close() t...原创 2010-08-14 21:35:04 · 156 阅读 · 0 评论 -
Solr Replication
个人博客:http://demi-panda.comSolr的扩展(Scaling)当你的索引数量越来越大,你会发现你的搜索响应时间变得更慢,索引新内容的时间也会越来越长,那么,到了做出一些改变的时候了,幸运的是,solr很好的考虑到了这些情况,你只需要改变你的配置就可以了。以下将从三个方面讲述solr的scaling:l ...原创 2012-02-21 17:41:46 · 131 阅读 · 0 评论 -
Solr合并索引方式
1, Solr合并索引数据有两种方法,第一种是1.4版本中引入的,通过CoreAdminHandler来实现,示例如下:http://localhost:8983/solr/admin/cores?action=mergeindexes&core=core0&indexDir=/opt/solr/core1/data/index&indexD...原创 2011-12-09 15:41:48 · 313 阅读 · 0 评论 -
Solr 同义词搜索 synonyms
个人技术博客:http://demi-panda.comsolr.SynonymFilterFactory Creates SynonymFilter. Matches strings of tokens and replaces them with other strings of tokens. The synonyms parameter...原创 2012-02-09 18:30:46 · 295 阅读 · 0 评论 -
对Lucene PhraseQuery的slop的理解
所谓PhraseQuery,就是通过短语来检索,比如我想查“big car”这个短语,那么如果待匹配的document的指定项里包含了"big car"这个短语,这个document就算匹配成功。可如果待匹配的句子里包含的是“big black car”,那么就无法匹配成功了,如果也想让这个匹配,就需要设定slop,先给出slop的概念:slop是指两个项的位置之间允许的最大间隔距离,下面我举...原创 2012-06-12 10:55:21 · 146 阅读 · 0 评论 -
Solr Faceted
http://www.lucidimagination.com/devzone/technical-articles/faceted-search-solr 这篇文章介绍solr的faceted使用 非常好 收藏了原创 2011-11-26 17:07:19 · 93 阅读 · 0 评论 -
Solr 获取分词
个人博客:http://demi-panda.com Solr 1.4 有了对字段的分词。FieldAnalysisRequestHandler 可以对某个字段或字段类型的分词器对查询串取到分词数据。用 solr 的默认配置,如 solr 1.4.0。我用 mmseg4j 为例。在 solr.root/example/solr/conf/schema.xml 的 ...原创 2012-05-07 18:32:04 · 326 阅读 · 0 评论 -
Apache Lucene 和 Solr 进行位置感知搜索
个人技术博客:http://demi-panda.comApache Lucene 和 Solr 进行位置感知搜索 原文:http://www.ibm.com/developerworks/cn/java/j-spatial/原创 2012-04-26 18:26:55 · 100 阅读 · 0 评论 -
SolrOperationsTools使用
basic Solr scripts These scripts are used to manage the index data on the Solr server: NameDescriptionabcAtomic Backup post-Commit tells the Solr server to perf...原创 2011-10-18 17:41:32 · 120 阅读 · 0 评论 -
LucidGaze for Solr 搜索监测工具
LucidGaze for Solr 搜索监测工具LucidGaze for Solr 是由 Lucid 开发的开源 solr 监测工具,提供快照、存储、交互视图、比较各种 solr 性能指标。 包括:Record and graph metrics捕获多种 handler 的每秒请求数(Capture requests-per-second),如:S...原创 2010-11-14 22:56:01 · 146 阅读 · 0 评论 -
SOLR的分布式部署(复制)CollectionDistribute 快照分发 (精简版)
SOLR复制模式,是一种在分布式环境下用于同步主从服务器的一种实现方式,因之前提到的基于rsync的SOLR不同方式部署成本过高,被SOLR1.4版本所替换,取而代之的就是基于HTTP协议的索引文件传输机制,该方式部署简单,只需配置一个文件即可。以下讲解具体操作步骤: 步骤分主服务器和从服务器,允许有多个从服务器,即从服务器的配置一样。...原创 2010-08-20 13:34:35 · 146 阅读 · 0 评论 -
solr 分布式(复制)配置
solr 分布式(复制)配置 solr 分布式其实是分发,这概念像Mysql的复制。所有的索引的改变都在主服务器里,所有的查询都在从服务里。从服务器不断地(定时)从主服务器拉内容,以保持数据一致。先描述下我的环境:solr-master(192.168.1.181), solr-slave(192.168.1.155), jdke1.6.0_06, tomca...原创 2010-08-20 13:33:09 · 99 阅读 · 0 评论 -
solr1.4配置IKAnalyzer3.2
个人技术博客:http://demi-panda.com 搜索引擎相关开源框架,一开始是lucene,这两天看了看solr,下了一个最新版本,配置了下,遇到一些问题。解决了一些,还有一些没有解决,这里将我的一些已经解决的问题,分享给大家。 1、下载solr1.4 http://apache.freelamp.com/lucene/solr/ (注:这里有及时solr的最新版本) ...原创 2010-08-14 23:56:22 · 109 阅读 · 0 评论 -
Lucene/Solr开发经验[转载]
Lucene/Solr开发经验[转载] 转载:张驰有道 http://www.jinsehupan.com/blog/?p=25 多谢他的介绍。1、开篇语2、概述3、渊源4、初识Solr5、Solr的安装6、Solr分词顺序7、Solr中文应用的一个实例8、Solr的检索运算符[开篇语]按照惯例应该写一篇技术文章了,这次结合Lucene/Solr来分享一下开发经验。Lucen...原创 2010-08-14 21:44:38 · 107 阅读 · 0 评论 -
Lucene Similarity (Lucene 文档评分score机制详解)
个人博客:http://demi-panda.com 文档的分值代表了该文档在特定查询词下对应的相关性高低,他关联着信息检索向量空间模型中的向量夹角的接近度。一个文档越与查询词相关,得分越高。分值计算公式如下:score(q,d) = coord(q,d) · queryNorm(q) · ∑ ( tf(t in d) · id...原创 2012-04-06 16:06:55 · 124 阅读 · 0 评论