不得不说,网络是发达的,但是网上复制粘贴党实在太强大,甚至有些还是复制了一半的,好吧,还是自己来写一篇可用的吧。
基于环境:Tomcat 7+solr 3.5+Paoding
注意:paoding在google code上的2.x版本不能兼容solr3.5,所以需要用到修改过的版本:paoding-analysis-3.jar
安装详细:
- 访问 http://www.apache.org/dyn/closer.cgi/lucene/solr ,在这个网址里选择一个路径 , 下载 solr 3.5 的版本。
- solr3.5 在本机解压缩以后,把 apache-solr-3.5.0\example\webapps目录下的solr.war文件拷贝到Tomcat 7的webapps目录下。
- 启动Tomcat7,自动解压solr.war包。然后在 Tomcat 7\webapps\solr 目录里 新建一个 文件夹 conf。
- 把 solr3.5 本机解压缩文件夹 apache-solr-3.5.0\example 下的 multicore 文件夹 拷贝到 Tomcat 7\webapps\solr\conf 目录下。
- 在 Tomcat 7\conf\Catalina\localhost 目录下新建一个 solr.xml 文件 , 里面的内容如下
<?xml version="1.0"encoding="UTF-8"?><Context docBase="${catalina.home}/webapps/solr.war" debug="0"crossContext="true" ><Environment name="solr/home" type="java.lang.String"value="${catalina.home}/webapps/solr/conf/multicore" override="true" /></Context>
- 访问你的solr项目 http://localhost:8080/solr 会显示出两个core,solr 正常运行。
- 前往 http://code.google.com/p/paoding 将最新的包下载下来并解压缩,可以得到dic目录和src目录。
- 将src中文件及dic目录放到<solr_home>/WEB-INF/classes目录下,并将paoding-analysis-3.jar放到<solr_home>/WEB-INF/lib目录里,目录没有可以自行创建。
- 修改<solr_home>/WEB-INF/classes/paoding-dic-home.properties配置文件
paoding.dic.home=classpath:dic
- 然后在solr中加入paoding分词器,打开<solr_home>/conf/multicore/core0/conf/schema.xml文件,在types节点内加入节点(另一个核心如果需要也需要配置一下)
<fieldType name="text" class="solr.TextField" positionIncrementGap="100"><analyzer type="index"><tokenizer class="net.paoding.analysis.analyzer.solr.ChineseTokenizerFactory" mode="most-words"/></analyzer><analyzer type="query"><tokenizer class="net.paoding.analysis.analyzer.solr.ChineseTokenizerFactory" mode="most-words"/></analyzer></fieldType>
- 再重启tomcat,solr3.5就可以使用paoding分词器了。
- 访问 http://localhost:8080/solr/core0/admin/analysis.jsp 测试: