Solr简介
Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服
务器。Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。
Solr可以独立运行,运行在Jetty、Tomcat等这些Servlet容器中,Solr 索引的实现方法很简单,用 POST 方法向 Solr 服务器发送一个描述 Field 及其内容的 XML 文档,Solr根据xml文档添加、删除、更新索引 。Solr 搜索只需要发送 HTTP GET 请求,然后对 Solr 返回Xml、json等格式的查询结果进行解析,组织页面布局。Solr不提供构建UI的功能,Solr提供了一个管理界面,通过管理界面可以查询Solr的配置和运行情况。
基于Solr实现站内搜索扩展性较好并且可以减少程序员的工作量,因为Solr提供了较为完备的搜索引擎解决方案,因此在门户、论坛等系统中常用此方案。
注: Solr从5.x版本开始就不依赖Tomcat等容器了,可以直接部署使用。网上查了很多部署教程,都是老版本的。
Solr的部署和配置:
下载安装包:
CHD安装包下载方法:
复制该地址:http://archive.cloudera.com/cdh5/cdh/5/ + 加上自己要下载的版本.tar.gz就可以下载了。
解压软件包:
tar -zxvf solr-4.10.3-cdh5.13.2.tar.gz ./
将解压后文件中的dist文件夹下的solr-4.10.3-cdh5.13.2.war放到Tomcat的webapps下。
通过启动Tomcat来解压该文件
bin/startup.sh
之后就会在webapps下看到解压好的solr-4.10.3-cdh5.13.2,重命名一下,修改为solr
- 然后添加solr扩展服务包:
将solr-4.10.3-cdh5.13.2/example/lib/ext/ 下的所有jar复制到 webapps/solr/WEB_INF/lib中 - 部署日志环境:
将solr-4.10.3-cdh5.13.2/example/resources/log4j.properties复制到webapps/solr/WEB-INF/classes中(注:如果classes不存在,就需要自己手动创建:mkdir classes) - 创建solrhome文件夹存放Solr服务器suoyou所有配置文件的目录。
我在solr解压目录里创建的,这个可以随意创建。 - 配置solrhome,告诉solr服务器solrhome的所在位置。
修改webapps\solr\WEB-INF\web.xml
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/home/hadoop/solr-4.10.3-cdh5.13.2/solrhome/</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
配置完成后启动tomcat,进入8080端口查看。
Solr操作命令:
- 查看帮助
bin/sorl -help
可以看到solr有哪些子命令,如start,stop,restart,healthcheck,create,create_core,create_collection,delete,version等
- 创建(注:如果是单机版要创建core,如果是分布式的要创建collection)
bin/solr create -c 项目名称
参数说明:
- -c 要创建的collection名称
- -d 配置文件目录
- -shards 该collection要创建的分片数
- -replicationFactor 每个分片要创建的副本数,建议为奇数
- 删除collection
./hbase-indexer delete-indexer --name 'collection_vip'