Solr
1.Solr是什么
Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务。
solr可以实现全文检索功能(索引、搜索),solr是可以独立运行在tomcat等web容器中。
Solr不提供构建UI的功能,Solr提供了一个管理界面,通过管理界面可以查询Solr的配置和运行情况。
Solr主要对外提供索引和搜索服务。
2.Solr和lucene的区别
Lucene是一个全文检索的工具包(是一堆的jar 包,不能独立运行,由应用程序通过lucene的jar实现全文检索)。
Solr 是一个全文检索的服务,solr是运行在tomcat等web容器中,对外提供http 的索引和搜索服务。
Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。
3.Solr下载
从Solr官方网站(http://lucene.apache.org/solr/ )下载Solr4.10.3,根据Solr的运行环境,Linux下需要下载lucene-4.10.3.tgz,windows下需要下载lucene-4.10.3.zip。
Solr使用指南可参考:https://wiki.apache.org/solr/FrontPage。
bin:可执行程序、脚本
contrib:存放了一些扩展的包,用于索引和搜索
dist:其中有一个solr-4.10.3.war 将其部署到tomcat容器中,运行solr
docs:使用说明文档
example:存储了很多solr开发使用的例子工程及目录结构等。
- example/solr:
该目录是一个包含了默认配置信息的Solr的Core目录。 - example/multicore:
该目录包含了在Solr的multicore中设置的多个Core目录。 - example/webapps:
该目录中包括一个solr.war,该war可作为solr的运行实例工程。
licenses:solr相关的一些许可信息
licenses:许可
4.Solr运行环境
Solr4.10.3在jdk1.7下运行
Solr:Solr4.10.3
Jdk:jdk1.7.0_72
Tomcat:apache-tomcat-7.0.82
5.Solr安装配置
5.1.SolrCore的安装配置
5.1.1.SolrHome和Solrcore
SolrHome是一个目录,是Solr运行的主目录,SolrHome目录中包括多个SolrCore目录,每个solrcore目录对应一个索引文件目录 。
SolrCore即solr实例对外提供索引和搜索服务。
SolrCore是一个逻辑的概念,将一个solr工程(部署在tomcat中)逻辑区别开以solrcore为单位的服务。
5.1.2.目录结构
SolrHome目录 结构(solr-4.10.3\example\solr例子)
SorCore的目录结构
5.1.3.创建SolrCore
5.1.3.1.创建目录
先创建SolrHome
D:\temp下创建solr目录 ,SolrHome目录放到D:\temp\solr下。
solrHome目录如下:
SolrCore目录:
5.1.3.2.配置文件
在solrCore的conf 下有一个solrconfig.xml文件,此文件就是solrCore的配置文件:
- 加载jar包
以下配置是solrcore运行所加载的jar包:
将solr下载包中的contrib、dist两个目录 拷贝到d:\temp\solr下
- 更改索引文件目录
每个SolrCore都有自己的索引文件目录 ,默认在SolrCore目录下的data中。
data数据目录下包括了index索引目录 和tlog日志文件目录。
如果不想使用默认的目录也可以通过solrConfig.xml更改索引目录 ,如下:
- 配置请求处理器
客户端请求Solr请求处理器,进行索引和搜索。
在solrconfig.xml中配置了很多的请求处理器
requestHandler请求处理器,定义了索引和搜索的访问方式。
通过/update维护索引,可以完成索引的添加、修改、删除操作。
提交xml、json数据完成索引维护,之后的文章中索引维护小节详细介绍。
通过/select搜索索引。
设置搜索参数完成搜索,搜索参数也可以设置一些默认值,如下:
<requestHandler name="/select" class="solr.SearchHandler">
<!-- 设置默认的参数值,可以在请求地址中修改这些参数-->
<lst name="defaults">
<str name="echoParams">explicit</str>
<int name="rows">10</int><!--显示数量-->
<str name="wt">json</str><!--显示格式-->
<str name="df">text</str><!--默认搜索字段-->
</lst>
</requestHandler>
5.1.4.Solr工程部署
将官方提供的Solr.war部署到tomcat下。
官方提供的solr的war包是dist\solr-4.10.3.war
5.1.4.1.第一步:部署solr.war
将dist\solr-4.10.3.war拷贝到Tomcat的webapp目录下改名为solr.war
启动tomcat后,solr.war自动解压,将原来的solr.war删除
生成solr工程目录:
5.1.4.2.第二步:拷贝扩展包到solr工程
拷贝example\lib\ext 目录下所有jar包拷贝到Tomcat的webapp\solr\WEB-INF\lib目录下
5.1.4.3.第三步:设置solrHome
修改Tomcat目录 下webapp\solr\WEB-INF\web.xml文件,如下所示:
设置Solr home
5.1.4.4.第四步:拷贝log4j.properties文件
在 Tomcat下webapps\solr\WEB-INF目录中创建文件 classes文件夹,
复制Solr目录下example\resources\log4j.properties至Tomcat下webapps\solr\WEB-INF\classes目录
5.1.5.启动tomcat
5.1.6.solr工程测试
如下可以测试solr下各各Field的索引和搜索的分词效果。
如下是solrcore的索引维护界面:
如下是SolrCore的搜索界面:
5.1.7.多SolrCore配置
一个solr工程可以通过多个solrcore分别对外提供索引和搜索服务。
每个solrCore单独对外提供http的索引和搜索服务,相关于一个mysql数据(Solr工程)运行了多个数据库(solrcore)
配置多SolrCore的好处:
1.一个solr工程对外通过SorlCore 提供服务,每个SolrCore相当于一个数据库,这个功能就相当于一个mysql可以运行多个数据库。
2.将索引数据分SolrCore存储,方便对索引数据管理维护。
3.SolrCloud集群需要使用多core。
复制原来的core目录为collection2,目录结构如下:
修改collection2下的core.properties,如下:
name=collection2
修改config目录下的solrconfig.xml
<dataDir>${solr.data.dir:D:/temp/solr/solrHome/collection2/data}</dataDir>
启动tomcat: