摘要: Solr有诸多分词器,本文介绍Solr6与中文分词库IKAnalyzer的整合,在此之前,你需要有一个可以运行Solr的环境,参见Solr6.0与Jetty、Tomcat在Win环境下搭建/部署
准备环境
- Solr6
- IKAnalyzer分词器(ik-analyzer-solr6-6.0.jar)
要准备一个适合Solr6的ik-analyzer,需要动手做一些改动,我在这里大致描述了怎么修改源码
Solr6整合中文分词Ik-analyzer
- 确保已经装好了Solr6
- 下载支持Solr6的Ik-analyzer分词器(如ik-analyzer-solr6-6.0.jar)
- 在solr_home下新建文件夹
lib
,将这个jar文件复制进去。
- 配置
schema.xml
:在solr_home/core0/conf下找到schema.xml.bak
文件,将其重命名为schema.xml
,删除managed-schema。
- 编辑
schema.xml
:添加field和 fieldType 到schema.xml
文件。
<!-- IK Analyzer-->
<field name="ik_analyzer" type="text_ik" indexed="true" stored="true" multiValued="false" />
<fieldType name="text_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
测试
启动Solr,如果控制台没有报错,那就大功告成了。点击Analysis,测试几个数据看看。这个浙江省杭州市
已经能分析出来了。