先到solr-6.6.0/contrib/analysis-extras/lucene-libs这个包内将自带的中文分词jar取出
包名:lucene-analyzers-smartcn-6.6.0.jar
然后放到solr-6.6.0/server/solr-webapp/webapp/WEB-INF/lib
最后修改需要进行中文分词的core的config里面的managed-schema.xml文件
在</schema>这个结束标签之前添加如下一段
<!--添加lucene中文分词-->
<fieldType name="text_smart_analysis" class="solr.TextField" positionIncrementGap="0">
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
<filter class="solr.StopFilterFactory"
ignoreCase="true" words="lg_keywords.txt" />
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
<filter class="solr.StopFilterFactory"
ignoreCase="true" words="lg_keywords.txt" />
</analyzer>
</fieldType>
然后重启solr即可
问题遗留:是否能更换自定义词库