solr4.6下载地址:http://archive.apache.org/dist/lucene/solr/
找到4.6版本,下载solr-4.6.0.zip文件到本地。
解压文件到本地磁盘,我这里解压到D盘根目录下:
solr里面自带了jetty中间件,在D:\solr-4.6.0\example可以看到相关信息。
因为JAVA开发中使用tomcat比较多,所以我把solr4.6部署到tomcat里面了。
我用的tomcat是7.0版本,下载地址:http://tomcat.apache.org/download-70.cgi,
根据自己的操作系统选择是X64还是X86版本,也就是32bit跟64bit,我下载的是64-bit Windows zip这个版本。
1. 部署solr到tomcat的webapp目录。
在D:\solr-4.6.0\example\webapps里面有一个solr.war文件,做过JAVA WEB的应该知道怎么部署了吧。
复制solr.war到tomcat的webapps里,我的tomcat安装路径也是在D盘根目录下,D:\apache-tomcat-7.0.63
用好压或者rar解压solr.war到solr目录,然后solr.war就可以直接删掉了,当然你也可以选择启动tomcat解压solr.war文件。解压后如图:
2. 复制相关jar包到solr的lib目录。
在D:\solr-4.6.0\example\lib\ext目录下有一些关于log4j的jar包,把他复制到D:\apache-tomcat-7.0.63\webapps\solr\WEB-INF\lib里面。
3. 复制D:\solr-4.6.0\example\resources\log4j.properties到D:\apache-tomcat-7.0.63\webapps\solr\WEB-INF\classes目录,这里classes目录是没有的,需要你新建一个文件夹。
4. 编辑D:\apache-tomcat-7.0.63\webapps\solr\WEB-INF\web.xml
在第41行有一段注释掉的代码,
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/put/your/solr/home/here</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
修改代码为:
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>D:\solr-4.6.0\example\example-DIH\solr</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
这里主要是设置solr的目录,记得取消掉注释。
5. OK,开始启动tomcat了,因为我的tomcat端口修改了,所以访问路径如下:
http://localhost:8081/solr
可以从图片中看到访问成功。
6. 接下来要配置中文分词,中文分词现在用的最多的就是IK分词器。
IK分词器下载地址:http://git.oschina.net/wltea/IK-Analyzer-2012FF/
下载并解压,因为我们用的是solr4.6的版本,所以复制其中的IKAnalyzer2012FF_u1.jar到D:\apache-tomcat-7.0.63\webapps\solr\WEB-INF\lib目录下,复制IKAnalyzer.cfg.htm和stopword.dic到D:\apache-tomcat-7.0.63\webapps\solr\WEB-INF\classes目录下。
找到D:\solr-4.6.0\example\solr\collection1\schema.xml文件打开并编辑,line457位置(<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">的上面位置)添加,
<!--配置IK分词器-->
<fieldType name="text_ik" class="solr.TextField">
<!--索引时候的分词器-->
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<!--查询时候的分词器-->
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
line169位置<field name="text" type="text_general" indexed="true" stored="false" multiValued="true"/>将text_general改为text_ik。
7. 到此配置完成,重新启动tomcat。
http://localhost:8081/solr/#/
新增一个core,引入刚才修改schema.xml父目录的collection1
我这里的instanceDir是:D:\solr-4.6.0\example\solr\collection1,输入完后点击Add Core按钮。
新增完毕后选择collection1:
选择Analysis,输入需要分析的字段即可看到分词结果!