IKAnalyzer for Solr 7.x-8.x 使用指南-CSDN博客

本文链接：https://blog.csdn.net/gitblog_01091/article/details/147227939

IKAnalyzer for Solr 7.x-8.x 使用指南

ik-analyzer-solr ik-analyzer for solr 7.x-8.x 项目地址: https://gitcode.com/gh_mirrors/ik/ik-analyzer-solr

1. 项目介绍

IKAnalyzer 是一款基于 Java 的轻量级中文分词工具，它适用于 Lucene、Solr 等搜索引擎平台。本项目 ik-analyzer-solr 是 IKAnalyzer 的一个分支，专门为 Solr 7.x-8.x 版本进行适配和优化。它不仅继承了 IKAnalyzer 的强大分词功能，还扩展了词库，支持动态加载词典，使得在不需要重启 Solr 服务的情况下即可更新词典。

2. 项目快速启动

环境准备

JDK 1.8 或更高版本
Solr 7.x-8.x 版本

步骤

下载或构建 ik-analyzer-solr 的 jar 包。
将 jar 包放入 Solr 服务的 Jetty 或 Tomcat 的 webapp/WEB-INF/lib/ 目录下。
将本项目 resources 目录下的配置文件放入 Solr 服务的 Jetty 或 Tomcat 的 webapp/WEB-INF/classes/ 目录下，包括以下文件：
- IKAnalyzer.cfg.xml
- ext.dic
- stopword.dic
- ik.conf
- dynamicdic.txt
配置 Solr 的 managed-schema，添加 ik 分词器，配置示例如下：

<fieldType name="text_ik" class="solr.TextField">
  <analyzer type="index">
    <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
    <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
  <analyzer type="query">
    <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
    <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

启动 Solr 服务，测试分词功能。

3. 应用案例和最佳实践

动态词典更新：通过修改 dynamicdic.txt 文件，可以动态添加新词到分词器中，而无需重启 Solr 服务。
词库扩展：项目提供了丰富的扩展词典，用户可以根据自己的需求添加或删除词条。
性能优化：在 IKAnalyzer.cfg.xml 中设置 use_main_dict 为 false 可以关闭默认主词典，以提升分词性能。