Solr
文章平均质量分 78
iteye_4921
这个作者很懒,什么都没留下…
展开
-
SolrCloud之分布式索引及与Zookeeper的集成
一、概述Lucene是一个Java语言编写的利用倒排原理实现的文本检索类库,Solr是以Lucene为基础实现的文本检索应用服务,SolrCloud是Solr4.0版本开发出的具有开创意义的基于Solr和Zookeeper的分布式搜索方案,主要思想是使用Zookeeper作为集群的配置信息中心。也可以说,SolrCloud是Solr的一种部署方式,除SolrCloud之外,Solr还可以以...2015-08-11 15:21:13 · 126 阅读 · 0 评论 -
Solr Facet Field (Group by field)
solr将以导航为目的的查询结果称为facet. 它并不会修改查询结果信息, 只是在查询结果上根据分类添加了count信息, 然后用户根据count信息做进一步的查询, 比如淘宝的查询列表中, 上面会表示不同的类目相关查询结果的数量. 比如搜索数码相机, 在搜索结果栏会根据厂商, 分辨率等维度列出, 这里厂商, 分辨率就是一个个facet. 然后在厂商下面会有nikon, canon, sony...2014-12-24 20:13:35 · 588 阅读 · 0 评论 -
Solr 之Field,CopyField, DynamicField
Field: Field就是一个字段,定义一个Field很简单: <field name="price" type="sfloat" indexed="true" stored="true"/> 基本上属性也和FieldType类似,他的属性会覆盖掉FieldType的同名属性。 CopyField : 允许提交多个不同类型的字段集中...2014-10-31 20:40:00 · 173 阅读 · 0 评论 -
Solr4.7.0中整合中文分词mmseg4j-1.9.1
刚接触Lucene2.x和Solr2.x的时候,谈到中文分词,会让我立即想到用庖丁中文分词,庖丁中文分词因巨大的中文词库以及支持不限制个数的用户自定义词库,而且是纯文本格式,一行一词,使用后台线程检测词库的更新,自动编译更新过的词库到二进制版本而出名。 几年过去了,Lucene和Solr都发展到了4.7.x版本,重拾中文分词,发现庖丁中文分...2014-04-20 02:22:12 · 104 阅读 · 0 评论 -
Tomcat7中打印Solr(4.7.0)log - 配置log可以看成是我们配置Solr的一个必要操作
在Solr中,怎样使用log4j显示Solr Server的log?以Solr运行在Tomcat中为例 1. 将{solr-home}\example\resources下的log4j.properties如C:\Software\solr-4.7.0\example\resources下的log4j.properties文件拷贝到Tomcat中的lib目录下或者其它classpath...2014-03-12 22:40:22 · 198 阅读 · 0 评论 -
Solr4.x(4.7.0)中添加Solr实例(Core)
在下载的solr的解压包的事例中,默认只有一个Core(collection1),如果想添加自己的Core,比如我想添加一个Core(item),可以使用如下的步骤: 1. 在Solr的Home目录的solr目录中创建文件夹item(在C:\solr-tomcat\solr中创建item).如果你还不了解什么是Solr的Home目录,可以看下这个博客,一看便知:http://josh...2014-03-09 22:14:15 · 148 阅读 · 0 评论 -
Tomcat7中搭建Solr 4.x(4.7.0)
Windows平台下在Tomcat7中搭建Solr 4.x(4.7.0) 一、下载并安装Tomcat7.0: http://tomcat.apache.org/download-70.cgi 二、下载并安装最新版本的Solr,截止目前为止为Solr4.7.0,windows上下载solr-4.7.0.ziphttp://mirror.bit.edu.cn/apache/lu...2014-03-09 11:35:05 · 125 阅读 · 0 评论 -
Solr 4.x定时、实时增量索引 - 修改、删除和新增索引
开始之前,可以参考上篇博文全量索引-数据导入并索引:http://josh-persistence.iteye.com/admin/blogs/2017059 Solr增量索引配置 一、开始增量索引前的准备工作。1、认识data-config.xml中相关属性 <!-- transformer 格式转化:H...2014-02-13 21:16:10 · 149 阅读 · 0 评论 -
Solr 4.x 全量索引 - 导入并索引数据库数据
以solr4.6.1为例说明。 一、准备工作 1. 拷贝solr-dataimporthandler-4.6.1.jar到Tomcat的Solr lib目录中 在下载的solr的相关目录,如C:\Software\solr-4.6.1\dist中将solr-dataimporthandler-4.6.1.jar拷贝到C:\Software\ap...2014-02-13 16:16:31 · 169 阅读 · 0 评论 -
Solr5.x 集成 Tomcat8.x (并新增一个core)
如果想查看Solr4.x集成Tomcat7.x,查看怎样使用Solr中自带的Jetty来启动Solr的服务,可以查看我的其它博客。 一、下载Solr 5.3.1:http://www.apache.org/dyn/closer.lua/lucene/solr/5.3.1 二、下载Tomcat8.xhttp://archive.apache.org/dis...2015-11-26 15:35:13 · 352 阅读 · 0 评论 -
Solr 5.x的搭建(Solr自带的Jetty Server)与mmseg4j中文分词
前言: 如果你对Solr怎么和Tomcat 集成以及如何使用mmseg4j和自定义的词库丰富完善中文分词,可以参照我的其它与Solr相关的博客。这篇将以简练的方式给出如何搭建Solr5.x的服务(以截止目前为止最新的Solr5.3为例),而且将使用Solr自带的Jetty Server,而不是集成tomcat。 一、准备条件Solr5.x必须建立在JDK1.7的版...2015-10-17 19:05:01 · 205 阅读 · 0 评论 -
Solr中的Field、CopyField、DynamicField
Field: Field就是一个字段,定义一个Field很简单: <field name="tile" type="string" indexed="true" stored="true"/> Field的属性也和FieldType类似,他的属性会覆盖掉FieldType的同名属性。 CopyField 你可能想让documen...2015-10-06 16:14:03 · 233 阅读 · 0 评论 -
深入浅出Solr Cache
前言 Solr在Lucene之上开发了很多Cache功能,目前提供的Cache类型有:(1) filterCache(2) documentCache(3) fieldvalueCache (4) queryresultCache 一、Cache的生命周期 Solr查询的核心类是SolrIndexSearcher,...2015-10-06 00:50:08 · 218 阅读 · 0 评论 -
Slor5.x与mmseg4j的集成【使用solr自带的Jetty Server】
一、mmseg4j对Solr5.x的支持必须使用mmseg4j-2.0以上的版本,本例中我使用的是mmseg4j solr 2.3.0,使用的solr是截止目前为止的solr5.3.1,可下载附件,注意Solr-5.3.1是linux版本,如果需要windows版本,直接去官网上下载,so easy! 二、mmseg4j-2.0后的jar包只有两个了,一个是mmseg4j-core-1...2015-10-04 11:29:01 · 119 阅读 · 0 评论 -
中文分词中的正向最大匹配与逆向最大匹配
我们都知道,英文的分词由于单词间是以空格进行分隔的,所以分词要相对的容易些,而中文就不同了,中文中一个句子的分隔就是以字为单位的了,而所谓的正向最大匹配和逆向最大匹配便是一种分词匹配的方法,这里以词典匹配说明。 所谓词典正向最大匹配就是将一段字符串进行分隔,其中分隔 的长度有限制,然后将分隔的子字符串与字典中的词进行匹配,如果匹配成功则进行下一轮匹配,直到所有字符...2015-09-14 23:52:37 · 625 阅读 · 0 评论 -
Solr 在mmseg4j中使用中文停止词(的、地、得)
1. 从附件中下载中文停止词,如果有需要,你也可以下载英文停止词,操作步骤一样。 2. 可以在Tomcat的Solr 中的某个位置创建一个文件,比如叫stopwords.txt,此处我直接将stopwords.txt放在core目录下,即和schema.xml在同一个目录中。 3.将上面下载的中英文停止词加入到stopwords.txt中 4.如果你还不懂怎么在solr...2015-02-13 20:05:49 · 241 阅读 · 0 评论