solr7.4配置中文分词(二)
上一章为solr7.4安装与部署(一),这里示例配置solr官方提供的Smartcn的中文分词、IK的中文分词及拼音分词
配置smartcn中文分词器
solr安装包有提供Smartcn中文分词架包,在
/solr 7.4/contrib/analysis-extras/lucene-libs/
下,我这里使用solr 7.4,所以架包名称为lucene-analyzers-smartcn-7.4.0.jar
-
把smartcn中文分词器架包复制到solr项目的WEB-INF/lib目录下
cp /usr/local/solr-7.2.1/contrib/analysis-extras/lucene-libs/lucene-analyzers-smartcn-7.2.1.jar /usr/local/solr/tomcat/webapps/solr/WEB-INF/lib/
配置 fieldType -
找到solrhome/${collection}/conf/managed-schema
添加smartch中文分词器配置
<schema>
<!-- 配置中文分词器 -->
<fieldType name="text_zh" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
</fieldType>
</schema>
- 查看效果
配置IK Analyzer中文分词器
- 先下载 IK Analyzer中文分词器架包及相关配置文件。
- 将ik的相关文件 拷贝到 webapps\solr\WEB-INF\lib 目录下
- 在 solr_home\mycore1\conf\schema.xml 增加如下配置
<!-- 我添加的IK分词 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
- 查看效果
原文:https://blog.csdn.net/huangliuyu00/article/details/79491513