(二)solr-4.5.1中文分词器(IK-Analyzer)配置

solr分词困扰了我两天有余,最终终于出来了得意,把我的配置过程分享给大家。

1、 版本信息:

solr:4.5.1

ik-analyzer:IK Analyzer 2012FF_hf1

2、下载地址:

Ik Analyzer 2012FF_hf1.zip http://ik-analyzer.googlecode.com/files/IK%20Analyzer%202012FF_hf1.zip

solr-4.5.1.zip : http://lucene.apache.org/solr/ 

tomcat7:http://tomcat.apache.org/download-70.cgi

3、配置solr

解压下载后的Ik Analyzer 2012FF_hf1.zip 文件可得到如下所示的文件目录结构


(1)

在D盘根目录下面建一个目录 SOLR_HOME。

把解压后的solr-4.5.1\example 下的solr文件夹 拷贝到新建的SOLR_HOME目录下

(2)在自己的tomcat的server.xml文件(我的目录为D:\tomcat7\conf\server.xml)中加入URIEncoding="UTF-8"如下图所示:

主要目的是让tomcat支持中文



(3)

Ik Analyzer 2012FF_hf1.zip解压后里面的文件IKAnalyzer2012FF_u1.jar拷贝到D:\tomcat7\webapps\solr\WEB-INF\lib(前面我的博客里的相关文章已经说明了solr的基础配置)下面。

把IKAnalyzer.cfg.xml、stopword.dic拷贝到需要使用分词器的core的conf下面我的目录是(D:\SOLR_HOME\solr\collection1\conf)。

(4)

修改D:\SOLR_HOME\solr\collection1\conf\配置文件中schema.xm的配置,在<types></types>配置项间加一段如下配置:


接下来在schema.xml里面配置field类型,配置完成后我们将能使用text_ik类型进行查询如下图所示:


4.测试中文分词


输入想进行分词的中文内容,选择我们配置好的查询类型,点击查询按钮就得到如上图所示的查询结果。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值