solr 7.3安装配置、中文分词配置

  • 什么是solr,solr是Apache开源的一个分词索引库软件,其他另行百度
  • solr 下载安装
  1. 下载地址: 点击打开链接
  2. 解压下载的压缩包,solr 7.3 不需要使用Tomcat启动,自带jetty,
  3. window运行:  bin/solr.cmd start,solr默认端口为8983
  4. 访问:http://localhost:8983/solr/

  • solr 配置
  1. 创建core,solr.cmd create -c articles。其中articles是core的名称,可以自定义。
  2. 重启solr:solr.cmd -p 8983 restart

  3. 查看core:打开solr控制台,点击"Core Admin",列表中出现"articles",说明core创建成功

  4. 测试分词,选择刚才创建的core,点击Analysis进入分词分析页面,输入要分词的句子,选择分词库,点击分析按钮,即可看到分词结果

  5. solr默认不支持中文分词
  • 中文分词插件配置
  1. 添加中文分词插件:solr 7.3中自带中文分词插件,将solr-7.3.1\contrib\analysis-extras\lucene-libs\lucene-analyzers-smartcn-7.3.1.jar 复制到 solr-7.3.1\server\solr-webapp\webapp\WEB-INF\lib 目录中
  2. 配置中文分词,修改 solr-7.3.1\server\solr\articles【创建的core的名称】\conf\managed-schema文件,添加中文分词
     <!-- Chinese -->
        <fieldType name="text_cn" class="solr.TextField" positionIncrementGap="100">
          <analyzer type="index">
            <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
          </analyzer>
          <analyzer type="query">
            <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
          </analyzer>
        </fieldType>
    搜索Italian,在Italian下添加我们的中文配置

  3. 重启solr,测试中文分词

  4. OK
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值