CentOs 7.4 64位下Solr整合IK中文分词器环境搭建(图文超详细)

所需资源链接

  • 资源链接:https://pan.baidu.com/s/1Le5Yu-UikZ_D4hidWYsbhw 提取码:qkm6

IK Analyzer简介

  • IK Analyzer 是一个开源的,基亍 java 语言开发的轻量级的中文分词工具包。从 2006年 12 月推出 1.0 版开始, IKAnalyzer 已经推出了 4 个大版本。最初,它是以开源项目Luence 为应用主体的,结合词典分词和文法分析算法的中文分词组件。从 3.0 版本开始,IK 发展为面向 Java 的公用分词组件,独立亍 Lucene 项目,同时提供了对 Lucene 的默认优化实现。在 2012 版本中,IK 实现了简单的分词歧义排除算法,标志着 IK 分词器从单纯的词典分词向模拟语义分词衍化。

Solr是什么

  • Solr是一个开源搜索平台,用于构建搜索应用程序。 它建立在Lucene(全文搜索引擎)之上,是一个可扩展的,可部署,搜索/存储引擎,优化搜索大量以文本为中心的索引数据库。

Solr配置域属性详解

  • name:指定域的名称、用于搜索
  • type:指定域的类型
  • indexed:是否索引
  • stored:是否存储
  • required:是否必须
  • multiValued:是否多值

Solr整合IK中文分词器环境搭建

  • 上传资源包至指定software目录
    在这里插入图片描述
  • 解压资源包至指定目录
#切换至源码目录
cd /opt/software/

#解压solr资源包
tar -zxvf solr-4.10.3.tgz -C /opt/module/

#解压Ik资源包
unzip IK-Analyzer-2012FF_hf1.zip -d /opt/module/

#切换至模块目录
cd /opt/module/ && ls

在这里插入图片描述

  • 新建solrHome并/example/solr/所有资源至solrHome
#切换目录并新建Home文件夹
cd /opt/module/solr-4.10.3/ && mkdir solrHome

#copy命令
cp -r /opt/module/solr-4.10.3/example/solr/* solrHome/

在这里插入图片描述

  • 将solr-4.10.3/dist/solr-4.10.3.war重命名为solr.war
#切换目录
cd /opt/module/solr-4.10.3/dist/ && mv solr-4.10.3.war solr.war && ll

在这里插入图片描述

  • 拷贝solr.war至tomcat服务并启动tomcat解压war包
#copy命令
cp solr.war /opt/module/apache-tomcat-8.0.53/webapps/

#启动tomcat
startup.sh

在这里插入图片描述

  • 拷贝solr-4.10.3/example/lib/ext/*.jar 至solr/WEB-INF/lib/下
#copy命令
 cp /opt/module/solr-4.10.3/example/lib/ext/*.jar /opt/module/apache-tomcat-8.0.53/webapps/solr/WEB-INF/lib/
  • 编辑solr/WEB-INF/web.xml配置solrHome
#solrHome目录
/opt/module/solr-4.10.3/solrHome
#编辑文件
vim /opt/module/apache-tomcat-8.0.53/webapps/solr/WEB-INF/web.xml

在这里插入图片描述

  • 配置log4j日志
#新建classes目录
mkdir /opt/module/apache-tomcat-8.0.53/webapps/solr/WEB-INF/classes

#拷贝log4j日志文件至classes目录下
cp /opt/module/solr-4.10.3/example/resources/log4j.properties /opt/module/apache-tomcat-8.0.53/webapps/solr/WEB-INF/classes   
  • 拷贝IKAnalyzer2012FF_u1.jar至solr/WEB-INF/lib/下
#切换目录
cd /opt/module/IK-Analyzer-2012FF_hf1/ && ll
#copy命令
cp IKAnalyzer2012FF_u1.jar /opt/module/apache-tomcat-8.0.53/webapps/solr/WEB-INF/lib/

在这里插入图片描述

  • 拷贝IK字典文件至classes目录
#copy命令
cp *.dic /opt/module/apache-tomcat-8.0.53/webapps/solr/WEB-INF/classes/
  • 拷贝IK 资源配置文件至classes目录
#copy命令
cp IKAnalyzer.cfg.xml /opt/module/apache-tomcat-8.0.53/webapps/solr/WEB-INF/classes/

  • 配置IK分词器
#编辑schema.xml文件
vim /opt/module/solr-4.10.3/solrHome/collection1/conf/schema.xml

#需要加入IK内容
<fieldType name="text_ik" class="solr.TextField">
     <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

在这里插入图片描述

  • 重启tomcat,通过http://主机ip:对应端口/solr测试访问
    在这里插入图片描述
  • 测试分词效果
    在这里插入图片描述
  • 到此、全部环境配置完成。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值