Solr7.7安装,配置中文分词 IKAnalyzer分词

ik文件包下载:IK-analyzer   提取码: solr    备用地址下载:IK-analyzer

配置从下面开始,1到3是必要的步骤,4到6是注释说明文件怎么用的

1.将ik-analyzer-7.7.0.jar包放入/soft/solr-7.7.0/server/solr-webapp/webapp/WEB-INF/lib/目录下

cp /soft/ik-analyzer-7.7.0.jar /soft/solr-7.7.0/server/solr-webapp/webapp/WEB-INF/lib/

2.将resources目录下的5个配置文件放入soft/solr-7.7.0/server/solr-webapp/webapp/WEB-INF/classes/目录下,用客户端工具,直接拖拽到目录下
① IKAnalyzer.cfg.xml
② ext.dic
③ stopword.dic
④ ik.conf
⑤ dynamicdic.txt

3.配置Solr的managed-schema,添加ik分词器,示例如下;
<!-- ik分词器 -->
<fieldType name="text_ik" class="solr.TextField">
  <analyzer type="index">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
      <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
  <analyzer type="query">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
      <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

4.重启Solr服务,测试分词;

 


5.ik.conf文件说明:
files=dynamicdic.txt
lastupdate=0
files为动态词典列表,可以设置多个词典表,用逗号进行分隔,默认动态词典表为dynamicdic.txt;
lastupdate默认值为0,每次对动态词典表修改后请+1,不然不会将词典表中新的词语添加到内存中。


6.dynamicdic.txt 为动态词典
在此文件配置的词语不需重启服务即可加载进内存中。 以#开头的词语视为注释,将不会加载到内存中

转载于:https://www.cnblogs.com/caleyun/p/10455985.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值