所需资源链接
资源链接:https://pan.baidu.com/s/1Le5Yu-UikZ_D4hidWYsbhw 提取码:qkm6
IK Analyzer简介
IK Analyzer 是一个开源的,基亍 java 语言开发的轻量级的中文分词工具包。从 2006年 12 月推出 1.0 版开始, IKAnalyzer 已经推出了 4 个大版本。最初,它是以开源项目Luence 为应用主体的,结合词典分词和文法分析算法的中文分词组件。从 3.0 版本开始,IK 发展为面向 Java 的公用分词组件,独立亍 Lucene 项目,同时提供了对 Lucene 的默认优化实现。在 2012 版本中,IK 实现了简单的分词歧义排除算法,标志着 IK 分词器从单纯的词典分词向模拟语义分词衍化。
Solr是什么
Solr是一个开源搜索平台,用于构建搜索应用程序。 它建立在Lucene(全文搜索引擎)之上,是一个可扩展的,可部署,搜索/存储引擎,优化搜索大量以文本为中心的索引数据库。
Solr配置域属性详解
name:指定域的名称、用于搜索 type:指定域的类型 indexed:是否索引 stored:是否存储 required:是否必须 multiValued:是否多值
Solr整合IK中文分词器环境搭建
上传资源包至指定software目录 解压资源包至指定目录
#切换至源码目录
cd / opt/ software/
#解压solr资源包
tar - zxvf solr- 4.10 .3 . tgz - C / opt/ module/
#解压Ik资源包
unzip IK- Analyzer- 2012F F_hf1. zip - d / opt/ module/
#切换至模块目录
cd / opt/ module/ && ls
新建solrHome并/example/solr/所有资源至solrHome
#切换目录并新建Home文件夹
cd / opt/ module/ solr- 4.10 .3 / && mkdir solrHome
#copy命令
cp - r / opt/ module/ solr- 4.10 .3 / example/ solr
将solr-4.10.3/dist/solr-4.10.3.war重命名为solr.war
#切换目录
cd / opt/ module/ solr- 4.10 .3 / dist/ && mv solr- 4.10 .3 . war solr. war && ll
拷贝solr.war至tomcat服务并启动tomcat解压war包
#copy命令
cp solr. war / opt/ module/ apache- tomcat- 8.0 .53 / webapps/
#启动tomcat
startup. sh
拷贝solr-4.10.3/example/lib/ext/*.jar 至solr/WEB-INF/lib/下
#copy命令
cp / opt/ module/ solr- 4.10 .3 / example/ lib/ ext
编辑solr/WEB-INF/web.xml配置solrHome
#solrHome目录
/ opt/ module/ solr- 4.10 .3 / solrHome
#编辑文件
vim / opt/ module/ apache- tomcat- 8.0 .53 / webapps/ solr/ WEB- INF/ web. xml
#新建classes目录
mkdir / opt/ module/ apache- tomcat- 8.0 .53 / webapps/ solr/ WEB- INF/ classes
#拷贝log4j日志文件至classes目录下
cp / opt/ module/ solr- 4.10 .3 / example/ resources/ log4j. properties / opt/ module/ apache- tomcat- 8.0 .53 / webapps/ solr/ WEB- INF/ classes
拷贝IKAnalyzer2012FF_u1.jar至solr/WEB-INF/lib/下
#切换目录
cd / opt/ module/ IK- Analyzer- 2012F F_hf1/ && ll
#copy命令
cp IKAnalyzer2012FF_u1. jar / opt/ module/ apache- tomcat- 8.0 .53 / webapps/ solr/ WEB- INF/ lib/
#copy命令
cp * . dic / opt/ module/ apache- tomcat- 8.0 .53 / webapps/ solr/ WEB- INF/ classes/
#copy命令
cp IKAnalyzer. cfg. xml / opt/ module/ apache- tomcat- 8.0 .53 / webapps/ solr/ WEB- INF/ classes/
#编辑schema. xml文件
vim / opt/ module/ solr- 4.10 .3 / solrHome/ collection1/ conf/ schema. xml
#需要加入IK内容
< fieldType name= "text_ik" class = "solr.TextField" >
< analyzer class = "org.wltea.analyzer.lucene.IKAnalyzer" / >
< / fieldType>
重启tomcat,通过http://主机ip:对应端口/solr测试访问 测试分词效果 到此、全部环境配置完成。