一、安装配置
1.自行下载解压,将solr-4.10\example\webapps文件夹下的solr.war文件copy到tomcat的webapps文件夹下。
2.启动tomcat,解压solr.war为webapps下的solr文件夹。
3.新建 一个data 目录(比如D:\data) ,拷贝:solr-4.10\example\solr 文件夹到 data文件夹下。
4.修改data\solr\collection1\conf\solrconfig.xml文件
<dataDir>${solr.data.dir:}</dataDir>
为:
<dataDir>${solr.data.dir:D:/data/solr/collection1/data}</dataDir>
5.修改 tomcat\webapps\solr\WEB-INF\web.xml文件
<!--
<env-entry> <env-entry-name>solr/home</env-entry-name>
<env-entry-value>/put/your/solr/home/here</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
-->
为:
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>D:/data/solr</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
此处修改了两个地方:
1)去掉注释
2)配置solr_home的地址
6.复制:solr-4.10\example\lib\ext 下的jar包到 tomcat\webapps\solr\WEB-INF\lib中
7.在 tomcat\webapps\solr\WEB-INF下创建文件 classes文件夹,将solr-4.10\example\resources\log4j.properties 文件复制到 classes 文件夹中
8.启动tomcat,访问http://localhost:8080/solr
二、配置IK Analyzer中文分词器。
1.下载IK Analyzer 2012FF_hf1,并解压。
2.复制 IKAnalyzer2012FF_u1.jar 文件到 tomcat\webapps\solr\WEB-INF\lib 下
3.复制 IKAnalyzer.cfg.xml 和 stopword.dic 两个文件到 tomcat\webapps\solr\WEB-INF\classes 文件夹下。
4.配置 data\solr\collection1\conf\schema.xml 文件。
在根标签<schema>下添加以下标签;
<!-- 配置IK分词器 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
以及
<field name="content" type="text_ik" indexed="false" stored="true" multiValued="true"/>
其中field和fieldtype的 name 可以按照自己的习惯命名。
为方便管理,把 field 以及 fieldType 标签分别放在各自标签集中定义的地方。
三、测试
1.打开http://localhost:8080/solr,选择collection1
2.选择analysis,用IK Analyzer使用手册里的一句话 “公路局正在治理解放大道路面积水问题” 来测试分词效果
分词配置成功。
四、注意事项
1.在往solr的索引里加入数据的时候,须在schema.xml文件当中配置field。
有两种配置方式:
1)静态配置:比如需要加入title,则须配置title的field
2)动态配置:
schema.xml文件中有<dynamicField>标签,比如:
在加入数据时,只需将fieldname写成 *_s 的形式,就能加入索引。type为string。
2.当前solr最新版本是5.4,但solr5的资料不多,尤其是配置ik的时候出了很多问题,没能有效解决,所以改为了4.10。