Lucence的solr的安装和Tomcat的整合(带中文分词)

Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。
Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。

这里写图片描述

前提需要下载
1、solr-lucence3.5.0(solr3.5.0)
2、jdk
3、tomcat

tomcat和solr的整合需要以下几个步骤,下面用图文介绍
1、将solr中的example中的solr拷贝到要作为服务器的位置
(我这里把apache-solr-3.5.0<附件中会提到下载地址>下面的example文件夹下所有的文件夹拷贝到    D:\lucence\solr\home中,如下图)

这里写图片描述

2、将solr中的war包解压到D:\lucence\solr\server\solr中,如下图

这里写图片描述

3、修改solr->home->conf文件夹中的solrconfig.xml的内容

这里写图片描述

4、设置相应的tomcat的context(tomcat目录下conf的server.xml文件),并未context设置相应的环境变量,说明solr的主目录的地址

这里写图片描述

![这里写图片描述](https://img-blog.csdn.net/20160329231647125)
5、取消VelocityResponseWriter这种输出格式(D:\lucence\solr\home\conf下的solrconfig.xml文件修改为false)

这里写图片描述
6、加入中文分词
6.1将中文分词的包拷贝到server的lib中(mmseg4j-all-1.8.5.jar和mmseg4j-solr-1.8.5.jar<附件会提供>拷贝到D:\lucence\solr\server\solr\WEB-INF\lib中)
6.2将中文分词添加到FieldTypez(下面内容添加到D:\lucence\solr\home\conf的schema.xml中)

<fieldType name="textComplex" class="solr.TextField" >
      <analyzer>
        <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>
      </analyzer>
    </fieldType>
    <fieldType name="textMaxWord" class="solr.TextField" >
      <analyzer>
        <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="dic"/>
      </analyzer>
    </fieldType>
    <fieldType name="textSimple" class="solr.TextField" >
      <analyzer>
        <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="dic"/>
      </analyzer>
    </fieldType>

这里写图片描述
6.3、将mmseg4j-1.8.5\data下面的所有数据拷贝到D:\lucence\solr\home\dic下面
这里写图片描述
启动tomcat,运行http://localhost:8080/solr/
这里写图片描述
点击Analysis进入分词器页面,大功告成,如下图:
这里写图片描述
附件:
apache-solr-3.5.0.zip :http://download.csdn.net/detail/l1028386804/9281511
mmseg4j-1.8.5.zip :http://download.csdn.net/detail/l1028386804/9284085
有不明白和配置错误的可随时联系!

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值