首先,solr5.5自带的中文分词实在是太low了。
无奈。
采用ik来试试。
首先,下载ik。地址https://github.com/EugenePig/ik-analyzer-solr5
下载完成后解压
在解压目录打开命令行窗口:mvn clean install
等着完成就可以了。
至此,打包完成。
编译结果如下:
拷贝ik-analyzer-solr5-5.x.jar 到solr5.5目录(F:\work1\tools\tomcat-8.0.32\webapps\solr\WEB-INF\lib)
下一步就是配置了:
如果你的core目录中没有schema.xml ,那么修改managed-schema文件是一样的,添加以下配置:
<fieldType name="text_ik" class="solr.TextField"> <analyzer type="index" useSmart="false" class="org.wltea.analyzer.lucene.IKAnalyzer" /> <analyzer type="query" useSmart="true" class="org.wltea.analyzer.lucene.IKAnalyzer" /> </fieldType>
然后重新启动solr5.5
测试:
结束。
另:关于ik的智能分词
配置須采用如下设置:
<fieldType name="text_ik" class="solr.TextField"> <analyzer type="index"> <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" /> </analyzer> <analyzer type="query"> <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" /> </analyzer> </fieldType>
之前的设置无法实现智能分词,及useSmart设置无效。