Solr全文检索服务器

 solr介绍

一、Solr它是一种开放源码的、基于 Lucene Java 的搜索服务器,易于加入到 Web 应用程序中。 二、Solr 提供了层面搜索(就是统计)、命中醒目显示并且支持多种输出格式(包括XML/XSLT 和JSON等格式)。它易于安装和配置,而且附带了一个基于 HTTP 的 管理界面。Solr已经在众多大型的网站中使用,较为成熟和稳定。 三、Solr 包装并扩展了 Lucene,所以Solr的基本上沿用了Lucene的相关术语。更重要的是,Solr 创建的索引与 Lucene 搜索引擎库完全兼容。 四、通过对Solr 进行适当的配置,某些情况下可能需要进行编码,Solr 可以阅读和使用构建到其他 Lucene 应用程序中的索引。 五、此外,很多 Lucene 工具(如Nutch、 Luke)也可以使用Solr 创建的索引。可以使用 Solr 的表现优异的基本搜索功能,也可以对它进行扩展从而满足企业的需要。

      准备工作:1、关闭防火墙,2、安装jdk1.8环境。3、创建生产环境下的目录/data/soft /,所有安装包都放在/data/下进行操作,产生的环境都放在/data/soft下面。

1、查看防火墙状态:

firewall-cmd --state

 如果是开启状态那么关闭掉就行了。

systemctl stop firewalld.service

 2、做之前的准备:jdk环境一定要是jdk1.8,centos7的话好像最低都是jdk1.8的,我的做实验前查了一下是jdk1.8的,所以就不在继续做jdk最新版本的了。

blob.png

在这里不做说明,如果不会请参考我专门做的关于jdk环境的博客.

3、创建安装目录

mkdir -p /data/soft

前三步做好后就直接开始做solr搜索服务器了。

正式开始:

1.下载solr7.2版本,解压

wget http://mirrors.shuosc.org/apache/lucene/solr/7.2.1/solr-7.2.1.tgz
tar -xvf solr-7.2.1.tgz

 3.下载tomcat,解压并测试tomcat是否异常,这步很重要,有的tomcat版本有冲突就会发生异常。

wget https://mirrors.cnnic.cn/apache/tomcat/tomcat-9/v9.0.6/bin/apache-tomcat-9.0.6.tar.gz
tar -xvf apache-tomcat-9.0.6.tar.gz
mv apache-tomcat-9.0.6 tomcat

对tomcat测试一下,看tomcat是否正常

 启动tomcat:sh bin/startup.sh

blob.png

查看端口是被监听

blob.png

查看服务是否启动,生产环境会用这种方式查看。

blob.png

查看tomcat日志:

 blob.pngblob.png

 生产环境最直接的检查方式。直接curl命令查看是否能够获取tomcat页面。

blob.png

 开始部署配置solr

1.把solr-7.2.0/server/solr-webapp里面的webapp拷贝到tomcat 的webapps下,重命名为solr

cp -r solr-7.2.1/server/solr-webapp/webapp/ /data/soft/tomcat/webapps/
mv webapp/ solr

2.拷贝solr-7.2.1\server\lib\ext 下的jar包以及lib目录下gmetric4j-1.0.7.jar,以metrics开头的jar包拷贝到 tomcat\webapps\solr 项目的WEB-INF\lib下

cd solr-7.2.1/server/lib/ext/
cp * /data/soft/tomcat/webapps/solr/WEB-INF/lib/
cp gmetric4j-1.0.7.jar metrics-* /data/soft/tomcat/webapps/solr/WEB-INF/lib/

3.拷贝solr-7.2.0\server 下的solr文件夹到其它非中文目录下,重命名为solrhome,我是建立到了/data/soft下

 cd solr-7.2.1/server/
 cp -r solr /data/soft/solrhome

blob.png

4.修改/data/soft/tomcat/webapps/solr/WEB-INF\web.xml, 找到如下代码,蓝色部分的,/put/your/solr/home/here 改为你自己的solrhome的路径,我的是/data/soft/solrhome路径。

   vim /data/soft/tomcat/webapps/solr/WEB-INF/web.xml,将注释去掉,并将solrhome的目录位置写进去:

<!--
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/put/your/solr/home/here</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
-->

如下图:

 blob.png

5..拷贝solr7.2.1\server\resources下的log4j.properties到/data/soft/tomcat/webapps/solr/WEB-INF\classes,如果WEB-INF下没有classes文件那么就创建一个classes文件夹

mkdir -p /data/soft/tomcat/webapps/solr/WEB-INF/classes
cp solr-7.2.1/server/resources/log4j.properties  /data/soft/tomcat/webapps/solr/WEB-INF/classes/

6.启动tomcat,访问需要完整路径,我的是http://192.168.241.131:8080/solr/index.html#/

blob.png

 看下日志,如果日志有下面这个样式就成功了。

blob.png

 在本机上curl一下,发现403,那么估计页面也是这样,如下图。

blob.png

blob.png

 7.注意:如果出现上图403错误,编辑web.xml照片截图中位置,找到如下代码,将其注释即可。

blob.png

 加上注释如下图:

blob.png

 再次刷新浏览器,会出现下图的页面。blob.png

配置solr的核心内容(core)

1.点击Core Admin,接着点击Add Core这项,点完之后会出现问题,但是会自动创建new-core目录。

blob.png

2.报错,提示缺少配置文件:Error CREATEing SolrCore 'new_core': Unable to create core [new_core] Caused by: Can't find resource 'solrconfig.xml' in classpath or '/data/soft/solrhome/new_core'

解决方法:拷贝server/solr/configsets/_default/下的conf文件夹到solrhome/new_core文件夹下

cp -r solr-7.2.1/server/solr/configsets/_default/conf  /data/soft/solrhome/new_core/

3.点击Add Core,此时会显示添加成功

 

blob.png

 4、配置中文分析器

1.拷贝dist文件夹里的solr-dataimporthandler-7.2.0.jar

cp  solr-7.2.1/dist/solr-dataimporthandler-7.2.1.jar /data/soft/tomcat/webapps/solr/WEB-INF/lib/

2.拷贝lucene-libs文件夹里的中文分析器的jar包

cp  solr-7.2.1/contrib//analysis-extras/lucene-libs/* /data/soft/tomcat/webapps/solr/WEB-INF/lib/
 vim solrhome/new_core/conf/managed-schema

<!-- ChineseAnalyzer -->
<fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
</fieldType>

如下图:

blob.png

4.自定义搜索业务域

<field name="item_title" type="text_ik" indexed="true" stored="true"/>
<field name="item_sell_point" type="text_ik" indexed="true" stored="true"/>
<field name="item_price" type="plong" indexed="true" stored="true"/>
<field name="item_image" type="string" indexed="false" stored="true" />
<field name="item_category_name" type="string" indexed="true" stored="true" />
<field name="item_desc" type="text_ik" indexed="true" stored="false" />
<field name="item_keywords" type="text_ik" indexed="true" stored="false" multiValued="true"/>
<copyField source="item_title" dest="item_keywords"/>
<copyField source="item_sell_point" dest="item_keywords"/>
<copyField source="item_category_name" dest="item_keywords"/>
<copyField source="item_desc" dest="item_keywords"/>

如下图:

blob.png

5.重启tomcat,就能发现自定义域已经出现

blob.png

6.测试分词效果

blob.png

 

 好了,到此为止,solr就告一段落,我们在部署的时候,心一定要细,有的地方千万仔细,进过这两天的熟悉给公司的阿里云服务器做这个,借签网络各位大神的手笔,写的不足之处,请大家多多关照。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值