solr4.6 + 中文分词 下载安装傻瓜教程

solr4.6下载地址:http://archive.apache.org/dist/lucene/solr/

 

找到4.6版本,下载solr-4.6.0.zip文件到本地。

解压文件到本地磁盘,我这里解压到D盘根目录下:

solr里面自带了jetty中间件,在D:\solr-4.6.0\example可以看到相关信息。

 

因为JAVA开发中使用tomcat比较多,所以我把solr4.6部署到tomcat里面了。

我用的tomcat是7.0版本,下载地址:http://tomcat.apache.org/download-70.cgi,

 

根据自己的操作系统选择是X64还是X86版本,也就是32bit跟64bit,我下载的是64-bit Windows zip这个版本。

 

 

1. 部署solr到tomcat的webapp目录。

 

在D:\solr-4.6.0\example\webapps里面有一个solr.war文件,做过JAVA WEB的应该知道怎么部署了吧。

复制solr.war到tomcat的webapps里,我的tomcat安装路径也是在D盘根目录下,D:\apache-tomcat-7.0.63


  用好压或者rar解压solr.war到solr目录,然后solr.war就可以直接删掉了,当然你也可以选择启动tomcat解压solr.war文件。解压后如图:

   

2. 复制相关jar包到solr的lib目录。

  在D:\solr-4.6.0\example\lib\ext目录下有一些关于log4j的jar包,把他复制到D:\apache-tomcat-7.0.63\webapps\solr\WEB-INF\lib里面。

  

3. 复制D:\solr-4.6.0\example\resources\log4j.properties到D:\apache-tomcat-7.0.63\webapps\solr\WEB-INF\classes目录,这里classes目录是没有的,需要你新建一个文件夹。

  

4. 编辑D:\apache-tomcat-7.0.63\webapps\solr\WEB-INF\web.xml

  在第41行有一段注释掉的代码,

   <env-entry>
       <env-entry-name>solr/home</env-entry-name>
       <env-entry-value>/put/your/solr/home/here</env-entry-value>
       <env-entry-type>java.lang.String</env-entry-type>
    </env-entry>

  

  修改代码为:

<env-entry>
       <env-entry-name>solr/home</env-entry-name>
       <env-entry-value>D:\solr-4.6.0\example\example-DIH\solr</env-entry-value>
       <env-entry-type>java.lang.String</env-entry-type>
    </env-entry>

  这里主要是设置solr的目录,记得取消掉注释。

5. OK,开始启动tomcat了,因为我的tomcat端口修改了,所以访问路径如下:

http://localhost:8081/solr

  可以从图片中看到访问成功。

6. 接下来要配置中文分词,中文分词现在用的最多的就是IK分词器。

  IK分词器下载地址:http://git.oschina.net/wltea/IK-Analyzer-2012FF/

  下载并解压,因为我们用的是solr4.6的版本,所以复制其中的IKAnalyzer2012FF_u1.jar到D:\apache-tomcat-7.0.63\webapps\solr\WEB-INF\lib目录下,复制IKAnalyzer.cfg.htm和stopword.dic到D:\apache-tomcat-7.0.63\webapps\solr\WEB-INF\classes目录下。

  找到D:\solr-4.6.0\example\solr\collection1\schema.xml文件打开并编辑,line457位置(<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">的上面位置)添加,


<!--配置IK分词器-->
    <fieldType name="text_ik" class="solr.TextField">
        <!--索引时候的分词器-->
        <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
        <!--查询时候的分词器-->
        <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    </fieldType>

line169位置<field name="text" type="text_general" indexed="true" stored="false" multiValued="true"/>将text_general改为text_ik。

7. 到此配置完成,重新启动tomcat。
http://localhost:8081/solr/#/


新增一个core,引入刚才修改schema.xml父目录的collection1

我这里的instanceDir是:D:\solr-4.6.0\example\solr\collection1,输入完后点击Add Core按钮。

新增完毕后选择collection1:


选择Analysis,输入需要分析的字段即可看到分词结果!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值