IK分词器是一个分词效果比较好的插件,相对于solr自带的分词器来说。因此,中文搜索的话我认为solr+IK分词器的组合能够满足中小网站所需了。前面已经完成了solr的安装,这一部分主要来给solr加入IK分词功能。
1. 下载IK分词器:
链接:http://pan.baidu.com/s/1eSzlgsU 密码:w73z
2. 配置IK分词器:
2.1)首先是解压该文件,会得到 ik-analyzer-solr5-5.x.jar、IKAnalyzer.cfg.xml、mydict.dic、stopword.dic 这几个文件。需要把这几个文件移动到安装好的solr6的相应位置去(若没有先创建目录):
ik-analyzer-solr5-5.x.jar 移动到 [PATHToSolrSERVER]/solr-webapp/webapp/WEB-INF/lib
其余三个文件移动到 [PATHToSolrSERVER]/solr-webapp/webapp/WEB-INF/classes
2.2)接下来是配置solr,在你需要配置的Core的conf下(solr库的配置文件),编辑managed-schema配置文件,添加如下行:
<fieldType name="text_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
2.3)重启solr.
3. 测试IK分词器:
打开solr界面的Analysis,选择刚新定义的类型’text_ik’进行测试,可以看到效果很不错!
4. 应用IK分词:
在配置待搜索字段的时候,只要在type上指定为’text_ik’即可在搜索该字段时,返回采用IK分词后的结果。配置示例如下:
<field name="searchText" type="text_ik" indexed="true" stored="true" multiValued="true" />