solr 7.3安装配置、中文分词配置

最新推荐文章于 2025-09-19 00:20:40 发布

原创最新推荐文章于 2025-09-19 00:20:40 发布 · 5.6k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#solr #solr 7.3 #中文分词

Java 专栏收录该内容

10 篇文章

订阅专栏

本文介绍如何安装配置Apache Solr并实现中文分词功能，包括环境搭建、核心配置及测试步骤。

什么是solr，solr是Apache开源的一个分词索引库软件，其他另行百度
solr 下载安装

下载地址：点击打开链接
解压下载的压缩包，solr 7.3 不需要使用Tomcat启动，自带jetty，
window运行： bin/solr.cmd start，solr默认端口为8983
访问：http://localhost:8983/solr/

solr 配置

创建core，solr.cmd create -c articles。其中articles是core的名称，可以自定义。
重启solr：solr.cmd -p 8983 restart
查看core：打开solr控制台，点击"Core Admin",列表中出现"articles"，说明core创建成功
测试分词，选择刚才创建的core，点击Analysis进入分词分析页面，输入要分词的句子，选择分词库，点击分析按钮，即可看到分词结果
solr默认不支持中文分词

中文分词插件配置

添加中文分词插件：solr 7.3中自带中文分词插件，将solr-7.3.1\contrib\analysis-extras\lucene-libs\lucene-analyzers-smartcn-7.3.1.jar 复制到 solr-7.3.1\server\solr-webapp\webapp\WEB-INF\lib 目录中

配置中文分词，修改 solr-7.3.1\server\solr\articles【创建的core的名称】\conf\managed-schema文件，添加中文分词

 <!-- Chinese -->
    <fieldType name="text_cn" class="solr.TextField" positionIncrementGap="100">
      <analyzer type="index">
        <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
      </analyzer>
      <analyzer type="query">
        <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
      </analyzer>
    </fieldType>

搜索Italian，在Italian下添加我们的中文配置