solr-7.x-IKAnalyzer-词库设置

在/opt/tools/solr-7.1.0/server/solr-webapp/webapp/WEB-INF/classes下加入对应词库配置

注意:所有文件都需要指定路径只写文件名即可,内部代码使用classloader按名称加载

  1. IKAnalyzer.cfg.xml
  2. ext.dic
  3. stopword.dic
  4. test_ik.conf
  5. dynamicdic.txt   

配置文件及jar包 链接:https://pan.baidu.com/s/1o6VLS0rVIHLbmh7SAWwCww 提取码:xznq 

修改配置文件managed-schema,注意synonyms.txt同义词文件要放在core配置文件目录,cloud模式下为zookeeper地址

<!-- ik分词器 -->
<fieldType name="text_ik" class="solr.TextField">
	<analyzer type="index">
		<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="test_ik.conf"/>
		<filter class="solr.LowerCaseFilterFactory"/>
		<!-- 同义词设置 -->
		<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
	</analyzer>
	<analyzer type="query">
		<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="test_ik.conf"/>
		<filter class="solr.LowerCaseFilterFactory"/>
		<!-- 同义词设置 -->
		<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
	</analyzer>
</fieldType>

synonyms.txt

分为两种配置方式,1 熊 => 狗熊  ,2 熊,狗熊,棕熊,北极熊

IKAnalyzer.cfg.xml

设置用户扩展词与停词字典文件

test_ik.conf

files=dynamicdic.txt 动态扩展词字典 lastupdate=123 字典版本号,修改版本后不需要重启自动加载


测试结果 设置停词

停词

设置动态扩展词,修改版本号后等待几秒后生效

动态扩展词

扩展词、停词,测试结果

测试结果

设置同义词,#号为注释

同义词测试结果

转载于:https://my.oschina.net/kdy1994/blog/3037024

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值