Solr4.4部署在Tomcat7中并且添加中文分词

Solr4.4部署在Tomcat7:

1.solr解压后放到E:\solrtest\server中

2.拷贝库到tomcat下,example\lib\ext下的5个jar包全部复制到tomcat/lib下

3.为了使log4j正常运行,还需要拷一个log4j.properties配置文件到tomcat/lib下,这里可以直接复制example\resource下的这个文件

4.solr的实例,为了方便,直接使用Example中配置好的一个solr实例.复制example目录下的,solr文件夹到任意目录下,比如复制到(E:\solrtest)

然后开始编辑一些配置文件:

5.设置工作目录,关联实例和tomcat

在$TOMCAT_HOME/conf/Catalina/localhost里新建solr.xml文件,内容如下:(路径用完整路径)

 <Context docBase="E:\solrtest\server" debug="0" crossContext="true" >   
  	<Environment name="solr/home" type="java.lang.String" value="E:\solrtest\home" override="true" />  
</Context> 

 

添加中文分词(MMseg4j 1.9.1):
1.将 dist 文件夹中的 3个JAR包放到 E:\solrtest\server\WEB-INF\lib

2.将dist中的mmseg4j-core-1.9.1.jar解压出来,将C:\Users\csy\Desktop\solr文件\mmseg4j-1.9.1\dist\mmseg4j-core-1.9.1\data里面的3个字典文件取出放到E:\solrtest\home\dic中

3.在E:\solrtest\home\collection1\conf\schema.xml 添加MMseg4j的配置

<fieldType name="textComplex" class="solr.TextField" >
      <analyzer>
        <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>
      </analyzer>
    </fieldType>
	<fieldType name="textMaxWord" class="solr.TextField" >
      <analyzer>
        <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="dic"/>
      </analyzer>
    </fieldType>
	<fieldType name="textSimple" class="solr.TextField" >
      <analyzer>
        <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="n:/OpenSource/apache-solr-1.3.0/example/solr/my_dic"/>
      </analyzer>
    </fieldType>


该配置可以在MMseg的 README文件中找到

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值