solr入门

wz1989love

于 2021-05-31 16:04:45 发布

阅读量174

点赞数

分类专栏： solr 文章标签： solr

本文链接：https://blog.csdn.net/wz1989love/article/details/117411542

版权

solr 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本文介绍了Apache Solr的下载与启动过程，详细讲解了如何在Windows环境下配置和启动Solr，并展示了如何进行索引库的新建、数据的增删改查操作。此外，还提到了Solr的时区设置、中文分词配置，特别是使用ik-analyzer进行中文分词的实践，帮助读者快速掌握Solr的基本操作。

摘要由CSDN通过智能技术生成

solr下载

sorl官网下载地址：https://solr.apache.org/downloads.html
我们下载7.7.3的windows版本
在这里插入图片描述

solr启动

压缩包解压后得到以下目录文档
在这里插入图片描述
我们打开bin文件夹，在地址栏中输入cmd，进入命令行界面。接着输入启动命令。
启动命令如下：

solr.cmd start

在这里插入图片描述
在浏览器中访问http://localhost:8983/进入solr可视化界面。

至此，solr启动成功。

solr基本操作

新建core（索引库）

在这里插入图片描述
按照图示操作以后，会报错。提示确实必要的配置文件。

其实solr已经在文件夹里给我们提供了默认的配置信息。我们打开solr-7.7.3\server\solr目录，可以看到这下面有2个文件夹，一个是我们刚刚创建的new_core索引库，一个是configsets配置设置。configsets这里面就存放着默认的配置信息。我们把solr-7.7.3\server\solr\configsets\_default下的conf整体复制到new_core里，再次点击Add Core，这次新增索引库成功。
进入我们刚刚创建的索引库，可以看到左侧有一列菜单，常用功能如上图所示。下面就通过上面这些常用功能，我们对solr做一些基本操作。
在这里插入图片描述

新增索引

在这里插入图片描述
在Documents通过发送json格式的数据可以新增索引。

修改索引

在这里插入图片描述
在Documents通过发送json格式的数据，数据中ID为需要修改索引的ID值，可以修改索引。

查询索引

新增修改后的索引在Query中点击Execute Query可以查询。
在这里插入图片描述

删除索引

在这里插入图片描述
在Documents通过发送XML格式的数据可以通过条件删除索引。

<delete>
   <query> id:"1"</query>
</delete>
<commit/>

删除全部索引

<delete><query>*:*</query></delete>
<commit/>

设置索引字段

细心的小伙伴应该已经发现了，新增的索引在查询的时候，age和name的数据类型并不像id一样是字符串类型。
在这里插入图片描述

按照正常的数据库逻辑，创建库表以后应该新增字段，然后才能存储数据。那为啥solr不需要设置字段就可以新增索引数据呢？其实solr在新增索引数据之前，已经默认新增了我们json中插入的字段。在solr-7.7.3\server\solr\new_core\conf中的managed-schema配置文件中可以找到新增的字段。
在这里插入图片描述
我们参照id的设置，来设置age和name的字段设置。日常使用中，我们会根据实际需要来设置索引字段。设置完成后，需要重启solr来保证配置生效。

在managed-schema中可以设置主键字段

<uniqueKey>id</uniqueKey>

设置完成后，重新插入索引数据，查询后可以看到索引数据的格式已经变更为字符串。
在这里插入图片描述

设置solr时区

我们可以在solr-7.7.3\server\logs文件夹中看到solr的日志信息，查询启动日志可以发现solr的日志打印时间比正常的时间少8小时，这是因为solr默认的时区不是东八区造成的，我们可以在solr启动配置文件中修改solr默认时区，这个很重要，在solr自动更新索引中时间是重要的参数。
在这里插入图片描述
在solr-7.7.3\bin中编辑启动文件solr.cmd，在文件中搜索时区关键字UTC可以找到时区设置代码

set SOLR_TIMEZONE=UTC
修改为
set SOLR_TIMEZONE=UTC+8

重启solr以后，我们再看日志，这时时间显示正常了。
在这里插入图片描述

中文分词设置

我们使用搜索引擎，有一个关键原因就是分词，利用搜索引擎的智能分词可以使搜索结果更智能化，更贴近用户的意愿。在solr的可视化界面中也提供了分词的模拟。
在这里插入图片描述
我们在输入框中输入分词测试，选择任意text开头的分词器，进行分词测试，得到如下结果。

明显这不符合汉字的分词习惯，所以我们需要引入中文分词器ik-analyzer。安装ik-analyzer分词器，首先需要下载架包。ik-analyzer分词器架包下载地址如下：

https://search.maven.org/search?q=com.github.magese

在这里插入图片描述
点击下载jar包。下载完成后把架包放到solr-7.7.3\server\solr-webapp\webapp\WEB-INF\lib下。接下来需要在solr-7.7.3\server\solr\new_core\conf\managed-schema中设置ik-analyzer分词器的使用。配置如下：

<fieldType name="text_ik" class="solr.TextField">
  <analyzer type="index">
	  <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
	  <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
  <analyzer type="query">
	  <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
	  <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

设置完成以后重启solr，再使用分词测试，选择text_ik做为分词器，此时我们发现分词后的结果已经符合中文的分词习惯了。
在这里插入图片描述

wz1989love

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
solr入门

solr下载sorl官网下载地址：https://solr.apache.org/downloads.html我们下载7.7.3的windows版本solr启动压缩包解压后得到以下目录文档我们打开bin文件夹，在地址栏中输入cmd，进入命令行界面。接着输入启动命令。启动命令如下：solr.cmd start在浏览器中访问http://localhost:8983/进入solr可视化界面。至此，solr启动成功。solr基本操作新建core（索引库）按照图示操作以后，会报错
复制链接

扫一扫

专栏目录