如果没有安装solr服务,请参考(Solr 一)搭建单机版solr服务器(centos)
solr自带的中文分词器是单字分词,效果如下:
在这里,为solr配置一个第三方的中文分词器,IK-analyzer
1.解压jar包 unzip IKAnalyzer2012FF_hf1.zip -d IK
2.将jar包,核心配置文件和停用词字典拷贝至solr服务中
3.将中文分词器配置到索引库
4.vim schema.xml,添加如下
5.配置完成,启动solr服务
6.页面访问
7.配置扩展词字典和停用词字典,改善分词效果
在IKAnalyzer.cfg.xml文件中配置扩展词字典和停用词字典
8.配置扩展词汇
例如"黄金剩女",IK分词器分词效果
在扩展词字典中加入剩女,在停用词字典中加入我,是
9.中文分词器配置完毕