Solr Lucene
文章平均质量分 56
iteye_2725
这个作者很懒,什么都没留下…
展开
-
ZooKeeper集群配置应用
概要ZooKeeper是Hadoop的正式子项目,它是一个针对大型分布式系统的可靠协调系统,提供的功能包括:配置维护、名字服务、分布式同步、组服务等。本文仅阐述ZooKeeper集群的配置方法(windows 7 64bit 环境下)。3个ZK实例~关于ZooKeeper的工作原理本文不做阐述,详见 ZooKeeper原理与它的集群工作流程 步骤一: 解...原创 2013-05-28 15:44:50 · 98 阅读 · 0 评论 -
Solr学习(二) Solr4.2.0+IK Analyzer 2012
开场白:本章简单讲述如何在solr中配置著名的 IK Analyzer 分词器。本章建立在 Solr学习(一) 基础上进行配置。通过(一)的介绍,目前已经成功部署好单实例 solr+tomcat 声明:描述的比较笼统繁琐,有偏差的地方请大家毫不留情的拍砖 准备工作:下载 “IK Analyzer 2012FF_hf1.zip”包。 详见:IK Analyze...原创 2013-03-21 00:01:32 · 167 阅读 · 0 评论 -
Solr学习(一) Solr4.2.0+Tomcat6.0 (windows7平台环境)部署实践
学习背景:公司搜索平台项目需求,技术选型为Solr开源框架方面技术,后续多实例集群管理,ZooKeeper集群管理等。本章节目的:单个实例Solr , 在windows环境下,部署于tomcat6 上的案例。声明:描述的比较笼统繁琐,有偏差的地方请大家毫不留情的拍砖 开始进入正题~~~环境及版本说明操作系统windows 7旗舰版 64位处理器...原创 2013-03-20 22:52:56 · 129 阅读 · 0 评论 -
Solr DirectoryFactory的选择
Solr的 directoryFactory总共有以下几种选择索引存储方案:1、solr.StandardDirectoryFactory,这是一个基于文件系统存储目录的工厂,它会试图选择最好的实现基于你当前的操作系统和Java虚拟机版本。2、solr.SimpleFSDirectoryFactory,适用于小型应用程序,不支持大数据和多线程。3、solr.NIOFSDirectoryF...原创 2013-10-15 11:51:15 · 369 阅读 · 0 评论 -
solr suggest 实现拼音或汉字 输入都能达到推荐搜索的要求.
我的案例 这里我们对title做suggest推荐搜索, 例如搜索"魔兽世界"和"moshoushijie" 都能出现 "魔兽世界XXXX"的相关推荐词 此时我们需要对title的词建立拼音索引, 而后对建立组合列copyField类型的字段 tt .. 代码片段 schema.xml<fields> .... <fie...原创 2013-10-15 11:04:00 · 625 阅读 · 0 评论 -
Solr 4.4 分布式查询请求API
分布式请求查询所有碎片的集合(集合是隐含在URL): http://localhost:8983/solr/collection1/select?查询所有碎片兼容的收集,明确规定: http://localhost:8983/solr/collection1/select?collection=collection1_recent查询所有碎片多个兼容的集合...原创 2013-10-14 12:02:53 · 147 阅读 · 0 评论 -
Solr 分布式管理API接口 (集合管理,分片管理)
以下所有操作仅限于Solr服务启动状态下. 复制整个collection 复制出来的整个核心不包含数据.http://localhost:6060/solr/admin/collections?action=CREATE&name=NewCollectionName&numShards=1&replicationFactor=1name: 要创建的新集合...原创 2013-10-14 12:00:23 · 188 阅读 · 0 评论 -
Solr shards.tolerant=true参数的作用,只查询存活的分片
http://localhost:6060/solr/DUOWAN1/select?q=*%3A*&wt=json&indent=true&shards.tolerant=true SolrCloud可以继续无间断服务,只要至少一台服务器主机的每一个碎片。如果你已经杀了一个特定的碎片shard,所有服务器到其他服务器的请求将导致503错误。加上此参数后,会只返回碎...原创 2013-10-14 10:18:04 · 866 阅读 · 0 评论 -
Solr 表达式语法相关[转]
转自: http://blog.csdn.net/lisong526/article/details/7472241 1. “:”指定字段查指定值,如返回所有值*:* 2. “?”表示单个任意字符的通配 3. “*”表示多个任意字符的通配(不能在检索的项开始使用*或者?符号) 4. “~”表示模糊检索,如检索拼写类似于”roam”的项这样写:roam~将找到形如foam和roams...原创 2013-10-10 11:14:26 · 102 阅读 · 0 评论 -
Solr date类型值默认少8小时解决方案
<field name="NewsDate" type="date" indexed="true" stored="true" default="NOW+8HOUR" docValues="true" /> NOW: 函数指当前格林尼治时间(北京时间-8小时)原创 2013-10-10 11:12:07 · 340 阅读 · 0 评论 -
Solr DataImport数据和实际数据相差很多【uniqueKey】
今天将 oracle 数据库中的一份表 235万条数据 dataImport 进 solr4.4 进行索引。导入后发现。 solr提示数据全部导入成功, 但是query时候只有 70万条数据。 一直傻傻的闷了半天。。。。。。why? 原来是 schema.xml 的 <uniqueKey>NewsID</uniqueKey> 搞鬼。 ...原创 2013-08-09 10:20:55 · 423 阅读 · 0 评论 -
Solr Cache 常见的高速缓存配置参数
缓存配置设置在solrconfig.xml中的查询部分。对于大多数高速缓存可以设置以下参数 类(你想使用的SolrCache实施可用的实现。) solr.LRUCachesolr.FastLRUCachesolr.LFUCache size 缓存中的最大条目数。 initialSize 初始容量的高速缓存中的条目数。...原创 2013-08-08 15:55:10 · 389 阅读 · 0 评论 -
Solr4.4 优化之 Filter Cache配置
本文描述solr的cache类型之一:filter cache。接下来,我会解释它是什么、怎么配置它以及如何更好的使用它。 What it is used for? 先从内部机制开始。FilterCache存储了一些无序的文档标识号(ID)。这些ID并不是我们在schema.xml里配置的unique key,而是solr内部的一个文档标识。请记住这个。 ...原创 2013-08-08 10:30:07 · 219 阅读 · 0 评论 -
Solr4.4 自行配置log4j内容
我们solr.war 装载后 在 webapps/下生成 solr的文件夹。 然后把 log4j.properties 放到 WEB-INF/classes 中。没有 classes 创建一个。 备注:solr的LOG4J 文件在 \solr-4.4.0\example\resources 目录下 log4j.pr...原创 2013-08-06 11:45:00 · 247 阅读 · 0 评论 -
关于Lucene搜索中查询器 PhraseQuery 的解释
这几天看Lucene,看到检索那块,被PhraseQuery折腾了一阵,那本《Lucene In Action》里的代码版本太旧了,也不知是翻译的问题还是我的理解问题,总之在看PhraseQuery的设置slop时费了半天劲,不过,总算是搞明白了,发个帖子来分享一下: 所谓PhraseQuery,就是通过短语来检索,比如我想查“big car”这个短语,那么如果待匹配的docu...原创 2013-06-13 16:30:26 · 235 阅读 · 0 评论 -
Solr学习(三) 单独ZooKeeper(外部)实例 + SolrCloud(tomcat)实例
开场白:简单讲述如何配置独立的外部 ZooKeeper 集群管理组件来管理 solr集群(多实例solr)本章建立在 Solr学习(一) 、Soer学习(二)基础上进行配置。 声明:描述的比较笼统繁琐,有偏差的地方请大家毫不留情的拍砖完成目标: 单zookeeper(独立)实例 + 多solr-4.2.0(tomcat)实例集群管理。 前期准备: 1、下载Zo...原创 2013-03-21 11:23:35 · 120 阅读 · 0 评论