Solr----3、solr7.2.0配置IKAnalyzer和自带的中文分词器

上篇文章中讲解如何安装单机版的solr,作为国内的网站,分析肯定是配置中文分析器!

    在solr4.4中我们使用的是IKAnalyzer中文分词器V2012版,现在都是2017年了啊!solr7本身提供了更好的方式! 在solr7.2.0本身提供中文的分词jar包,只需要我们进行简单的配置即可!但是在这里我还是会介绍IKAnalyzer中文分词器配置。

1. solr7.2.0自带的中文分词器

  环境:win7   jdk1.8  tomcat8  solr7.2.0     lucene-analyzers-smartcn-7.2.0.jar

 将解压后的solr-7.2.0\contrib\analysis-extras\lucene-libs下的lucene-analyzers-smartcn-7.2.0.jar放到Tomcat8\webapps\solr\WEB-INF\lib下。

 在Tomcat8\solr_h\solrhome\solr_core\conf找到managed-schema  添加已下代码

  <fieldType name="text_ik_zd" class="solr.TextField" positionIncrementGap="100">
    <analyzer type="index">
      <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
    <analyzer type="query">
      <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
  </fieldType>

重新启动Tomcat8,就可以使用solr自带的分词器了

2. solr7.2.0配置ik中文分词器

 环境:win7   jdk1.8  tomcat8  solr7.2.0  ik5.5    


IK分词器:

  • ext.dic为扩展字典
  • stopword.dic为停止词字典
  • IKAnalyzer.cfg.xml为配置文件
  • solr-analyzer-ik-5.1.0.jar  ik-analyzer-solr5-5.x.jar为分词jar包。

  • 1:将IK分词器 JAR 包拷贝到Tomcat8\webapps\solr\WEB-INF\lib下

  • 2:将词典 配置文件拷贝到 Tomcat8\webapps\solr\WEB-INF\classes下

  • 3: 更改在Tomcat8\solr_h\solrhome\solr_core\conf找到managed-schema配置文件,添加以下:

  •   <fieldType name="text_ik" class="solr.TextField">
        <analyzer type="index">
          <tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory" useSmart="true"/>
        </analyzer>
        <analyzer type="query">
          <tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory" useSmart="true"/>
        </analyzer>
      </fieldType>

重新启动Tomcat8,就可以使用ik的分词器了




  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小盒子_spring

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值