solr安装、使用、配置中文分词器

最新推荐文章于 2024-06-28 10:02:40 发布

yuruixin_china

最新推荐文章于 2024-06-28 10:02:40 发布

阅读量877

点赞数

分类专栏： java 文章标签： solr ik 搜索引擎中文分词器

本文链接：https://blog.csdn.net/yuruixin_china/article/details/80037873

版权

java 专栏收录该内容

91 篇文章 1 订阅

订阅专栏

solr 是基于lucene搜索库的一个搜索引擎框架,它将lucene进行了封装，实现了企业级应用框架。有提供完整集群及索引库优化方案。

solr可以独立运行，运行在Jetty、Tomcat等这些Servlet容器中，Solr 索引的实现方法很简单，用 POST 方法向Solr 服务器发送一个描述 Field 及其内容的 XML 文档，Solr根据xml文档添加、删除、更新索引。Solr 搜索只需要发送HTTP GET 请求，然后对 Solr返回Xml、json等格式的查询结果进行解析，组织页面布局。Solr不提供构建UI的功能，Solr提供了一个管理界面，通过管理界面可以查询Solr的配置和运行情况。

安装
下载地址：http://archive.apache.org/dist/lucene/solr/
（服务器在国外，下载会比较慢。可以使用solr6.1.0下载）
下载完成解压压缩包
启动solr
访问solr后台管理界面
http://127.0.0.1:8983/solr/#/
创建core（可以理解为mysql中的数据库，即一个服务可以有多个库）

solr create -c gxl_core

这里写图片描述

6. 进入你刚创建的core，测试分词

由于solr自带的分词器无法将中文根据语义分词，需要引入中文分词器IKAnalyzer

a. 将ik的jar放入solr-6.1.0\server\solr-webapp\webapp\WEB-INF\lib目录下
b. 修改solr-6.1.0\server\solr\corename\conf\managed-schema.xml文件，在schema标签中添加如下代码

<!-- IKAnalyzer-->
  <fieldType name="text_ik" class="solr.TextField" autoGeneratePhraseQueries="false">
            <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer" type="index">
            </analyzer>
            <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer" type="query">
            </analyzer>
    </fieldType>

c. 重启solr

solr restart -p 8983

经过以上操作后，再看下分词效果
这里写图片描述

嗯，满意了~

yuruixin_china

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
solr安装、使用、配置中文分词器

solr 是基于lucene搜索库的一个搜索引擎框架,它将lucene进行了封装，实现了企业级应用框架。有提供完整集群及索引库优化方案。 solr可以独立运行，运行在Jetty、Tomcat等这些Servlet容器中，Solr 索引的实现方法很简单，用 POST 方法向Solr 服务器发送一个描述 Field 及其内容的 XML 文档，Solr根据xml文档添加、删除、更新索引...
复制链接

扫一扫