添加自带的中文分词
1、 solr中自带中文分词插件
将solr\contrib\analysis-extras\lucene-libs\lucene-analyzers-smartcn.jar 复制到 solr\server\solr-webapp\webapp\WEB-INF\lib 目录中
2、配置中文分词
修改 solr\server\solr\articles【创建的core的名称】\conf\managed-schema文件,添加中文配置【在eclipse/idea等工具里打开,记事本打开容易出现编码问题】
添加以下代码
<!-- Chinese -->
<fieldType name="text_cn" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
</fieldType>
3、重启solr,测试中文分词
重启命令:solr restart -p 8983
添加中文分词ik-analyzer
1、下载ik-analyzer.jar包,并添加到solr-7.6.0\server\solr-webapp\webapp\WEB-INF\lib 目录中
2、在创建的core的配置文件managed-schema.xml中添加以下代码
<!-- ik分词器 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
3、 重启服务器, 测试
重启命令:solr restart -p 8983