上篇文章中讲解如何安装单机版的solr,作为国内的网站,分析肯定是配置中文分析器!
在solr4.4中我们使用的是IKAnalyzer中文分词器V2012版,现在都是2017年了啊!在升级过程中我本来还是使用这种方式进行的配置,但是solr7已经不支持了,那是因为solr7本身提供了更好的方式!
在solr7本身提供中文的分词jar包,只需要我们进行简单的配置即可!
1、创建一个core
solr5有两种运行模式,独立模式和云模式,独立模式是以core来管理,云模式是以collection来管理。我搭建的只是个单机版的内容,所以独立模式足可以使用。
solr create -c core1
2、配置jar
在/usr/local/solr-7.1.0/contrib/analysis-extras/lucene-libs目录下找到
复制到webapp的lib目录下
/usr/local/solr-7.1.0/server/solr-webapp/webapp/WEB-INF/lib
配置文件添加FieldType类型
<!-- ChineseAnalyzer -->
<fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
</fieldType>
3、启动solr,测试
【总结】
配置solr的中文分词器到现在为止就算配置完成了,但是这真是solr学习的万里长征的第一步啊,后面的学习还是需要继续深入啊!