下载mmseg4j-1.9
将mmseg4j-1.9.1\mmseg4j-1.9.1\dist中的三个文件:
加入到tomcat 的E:\apache-tomcat\webapps\solr\WEB-INF\lib中
再在E:\SolrHome\core0\conf的schema.xml中添加
<types>
<fieldtype name="string" class="solr.StrField" sortMissingLast="true" omitNorms="true"/>
<fieldType name="long" class="solr.TrieLongField" precisionStep="0" positionIncrementGap="0"/>
<!-- Solr mmseg4j -->
<fieldType name="text_zh" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" />
</analyzer>
</fieldType>
</types>
引入分词功能。
重启tomcat,输入中华人民共和国,开始分词:
分词成功。