1、下载Solr4.4.0.war(http://mirror.esocc.com/apache/lucene/solr/4.4.0/),将solr4.4.0/dist中的solr4.4.0.war拷贝到tomcat的webapps中,重命名为solr.war
2、将solr4.4.0/example/solr中的文件拷贝到F盘的solr_tomcat中
3、Solr使用UTF-8编码,所以要确认tomcat的编码要与其一致,so我们在tomcat/conf/server.xml中设置编码
<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" URIEncoding="UTF-8" />4、在tomcat/conf/Catalina/localhost中新建solr.xml,内容如下
<Context path="/solr" docBase="F:\apache-tomcat-6.0.37\webapps\solr"debug="0" crossContext="true"> <Environment name="solr/home" type="java.lang.String" value="F:\solr_tomcat" override="true"/> </Context>5、此时启动会提示出错Error filterstart: solr4.4.0(我是从4.4开始,4.3版本也存在此问题,可以下载之前版本的solr看看)的war包中不包含任何日志的jar包,你需要自己手动添加。将solr目录下example\lib\ext中的jar包copy到tomcat的lib中。这时候虽然添加jar包,但是没有对应的日志配置,需要将example\resources中的log4j.properties也放到tomcat/lib中。当然,你可以根据自己的需要更改配置。
6、再启动tomcat会看到日志信息,不出意外此时已经成功启动.打开http://localhost:8080/solr可以看到solr主界面,表示可以访问solr服务了。
7、配置中文分词器
http://code.google.com/p/ik-analyzer/downloads/detail?name=IK%20Analyzer%202012FF_hf1.zip&can=2&q=
(分词器下载地址,适用lucene4.x,solr4.x版本)
解压IKAnalyzer2012FF_hf1.zip,获得IK Analyzer2012FF_hf1.将该目录下的IKAnalyzer.cfg.xml,IKAnalyzer2012FF_u1.jar,stopword.dic
放到之前安装TOMCAT_HOME/webapps/solr/WEB-INF/lib/目录下
修改tomcat/solrapp/solr/collection1/conf/中的schema.xml,在<type></types>中增加如下内容:
1. <fieldType name="text_ik" class="solr.TextField">
2. <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
3. <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
4. </fieldType>
然后在field中引用此分词器:
<fieldname="text_ik" type="text_ik" indexed="true"stored="true" required="true" />
ok,到此结束,可以在Anaylsis中进行分词测试了。参考:http://www.cnblogs.com/hupengcool/archive/2013/05/11/3072573.html