从solr-6.5.0\contrib\analysis-extras\lucene-libs中将lucene-analyzers-smartcn-6.5.0.jar包复制到D:\360\tomcat8\apache-tomcat-8.0.36\webapps\solr\WEB-INF\lib
为实例添加对中文分词的支持。编辑solr_home\solr_core\conf下的managed-schema文件.
在</schema>前增加下面的内容
<fieldType name="text_smartcn" class="solr.TextField" positionIncrementGap="0">
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
</fieldType>
重启tomcat,http://localhost:8080/solr/index.html#/solr_core/analysis,输入中文后点击分词,查看效果
solr自带的中文分词器不能扩展用户词库