一)在Sorl高版本之后已经支持了完整的中文分词器支持中文的分词
1.7版本之后solr内置了中文分词器所以可以使用solr内置的分词器进行配置
1.在解压的目录内找到分词器包
2.将包放在solr项目的lib下
3.修改solrhome下的配置文件修改他下面的conf目录下的managed-schema文件
添加如下配置建立中文分词器
添加中文分词器的支持
<fieldType name="text_ik_zw" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
</fieldType>
4.测试域的分词
5.启动solr进行测试