Step1:
下载IK Analyzer分词器的压缩包,链接http://ik-analyzer.googlecode.com/files/IK%20Analyzer%202012FF_hf1.zip。
Step2:
将压缩包中的IKAnalyzer2012FF_u1.jar、IKAnalyzer.cfg.xml、stopword.dic三个文件拷贝到C:\Tomcat-Solr\webapps\solr\WEB-INF\lib文件夹下。
Step3:
修改C:\solrhome\collection1\conf文件夹下的schema.xml文件,在<type></type>标签之间添加如下内容
<!-- IK中文分词器 -->
<fieldTypename="text_ik"class="solr.TextField">
<analyzertype="index"isMaxWordLength="false"class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<analyzertype="query"isMaxWordLength="true"class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
Step4:
启动Tomcat,在浏览器中输入 http://localhost:8080/solr,在页面左侧菜单中选择Core为collection1,点击Analysis(漏斗形状)菜单,在右侧页面Filed Value文本框中
输入 :我是中国人。
Step5:
在Field Value下方,Analyse FieldName/FieldType中选择text_ik,然后点击左侧Analyze Value按钮,就能看到分词结果。
效果如下: