最近一段时间项目中查询需要支持中文分词和拼音分词,在网上找了不少资料,现在把做的过程整理出来,以后用到就可以直接看,下面直接上干活。
solr cloud6.1.0设置IK分词器:
准备资料:ik-analyzer-solr5-5.x.jar (这个jar是在网上找的 solr的6.x版本也能用)
IKAnalyzer.cfg.xml (IK扩展分词和扩展停止词的设置)
mydict.dic(扩展分词)
stopword.dic(扩展停止词)
IKAnalyzer.cfg.xml 的内容
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 用的话把注释去掉
<entry key="ext_dict">mydict.dic;</entry>
-->