solr与mmseg4j整合详细步骤(solr4.7.1和mmseg4j-1.9.1)

参考网址:http://www.tuicool.com/articles/67BFFz
准备工作:
mmseg4j-1.9.1.zip下载地址一:https://code.google.com/p/mmseg4j/downloads/list 
mmseg4j-1.9.1.zip下载地址二:http://download.csdn.net/detail/qin287624952/7902215
修复了reset()方法后的mmseg4j-analysis-1.9.1.jar下载地址:http://download.csdn.net/detail/qin287624952/7903177


solr4.7.1和mmseg4j-1.9.1整合步骤:


1、解压mmseg4j-1.9.1.zip压缩包,拷贝mmseg4j-1.9.1\dist目录下的三个jar包到tomcat\webapps\solr\WEB-INF\lib目录下





2、下载修复后的mmseg4j-analysis-1.9.1.jar,拷贝它到tomcat\webapps\solr\WEB-INF\lib目录下,替换第2步拷贝的同名文件


3、找到solr-home\collection1\conf目录下的schema.xml文件,向文件中加入如下代码:

在<fields>标签中添加

    <field name="mmseg4j_complex_name" type="text_mmseg4j_complex" indexed="true" stored="true"/>
    <field name="mmseg4j_maxword_name" type="text_mmseg4j_maxword" indexed="true" stored="true"/>
    <field name="mmseg4j_simple_name" type="text_mmseg4j_simple" indexed="true" stored="true"/>

在<types>标签中添加

    <!-- mmseg4j-->
<span style="white-space:pre">	</span><fieldType name="text_mmseg4j_complex" class="solr.TextField" positionIncrementGap="100" >  
<span style="white-space:pre">		</span><analyzer>  
<span style="white-space:pre">			</span><tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>  
<span style="white-space:pre">		</span></analyzer>  
<span style="white-space:pre">	</span></fieldType>  
<span style="white-space:pre">	</span><fieldType name="text_mmseg4j_maxword" class="solr.TextField" positionIncrementGap="100" >  
<span style="white-space:pre">		</span><analyzer>  
<span style="white-space:pre">		</span>    <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="dic"/>  
<span style="white-space:pre">		</span></analyzer>  
<span style="white-space:pre">	</span></fieldType>  
<span style="white-space:pre">	</span><fieldType name="text_mmseg4j_simple" class="solr.TextField" positionIncrementGap="100" >  
<span style="white-space:pre">	</span>    <analyzer>  <span style="white-space:pre">		</span>   
<span style="white-space:pre">			</span><tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="dic"/><span style="white-space:pre">	</span> 
<span style="white-space:pre">		</span></analyzer>  
<span style="white-space:pre">	</span></fieldType>
    <!-- mmseg4j-->

4、启动solr服务器,访问http://localhost:8983/solr进行测试,效果如下:



如果出现以上结果,恭喜!添加中文分词器mmseg4j1.9.1成功。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值