Solr与中文分词的整合以mmseg为例:
第一步:
将我们下载的分词器中mmseg-solr.jar、mmseg-core.jar mmseg-analyzer.jar(或者mmseg-all.jar)拷到我们solr下server里面的\solr\WEB-INF\lib目录下
第二步:
找到我们下载分词器包中的README.txt文件,将里面的关于Fieldtype内容拷贝到home下Config文件夹里的schema.xml的typs下面
<fieldType name="textComplex" class="solr.TextField" >
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>
</analyzer>
</fieldType>
<fieldType name="textMaxWord" class="solr.TextField" >
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="dic"/>
</analyzer>
</fieldType>
<fieldType name="textSimple" class="solr.TextField" >
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="dic"/>
</analyzer>
</fieldType>
第三步:
在home目录下新建一个文件夹dic,然后将我们下载的mmseg中data里面的文件拷贝到该dic目录下
进入solr/admin选择analysis,在Field里面选择Type,然后textComplex,然后就可以进行测试。