一、下载
二、上传
上传中文分词器jar包 IKAnalyzer2012FF_u1.jar
三、把IKAnalyzer2012FF_u1.jar添加到solr/WEB-INF/lib目录下
[root@itcast-01 example]# cd/usr/local/solr/tomcat/webapps/solr/WEB-INF/lib/
[root@itcast-01 lib]# mv/root/IKAnalyzer2012FF_u1.jar ./
四、复制IKAnalyzer的配置文件和自定义词典和停用词词典到Tomcat服务
[root@itcast-01 lib]# cd ../classes
[root@itcast-01 classes]# mv /root/ext.dic./
[root@itcast-01 classes]# mv/root/IKAnalyzer.cfg.xml ./
[root@itcast-01 classes]#mv /root/stopword.dic ./
五、在schema.xml配置中文分词器
根据业务需要选择相应的字段对应solr的字段,本项目涉及的数据库表如下:
根据表配置业务域--fieldname
[root@itcast-01 WEB-INF]# cd/usr/local/solr/solrhome/collection1/conf/
[root@itcast-01 conf]# vim schema.xml
另外,解释一下IK的配置,其中IKAnalyzer.cfg.xml为配置文件,主要用来配置扩展词库,禁止词词库等
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">ext.dic;</entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">stopword.dic;</entry>
</properties>
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
stopword.dic和ext.dic分别为禁止词词库和扩展词库,注意,词库的的编码方式为UTF-8 无BOM的编码方式,添加新词的时候,需要注意。