Elasticsearch搜索

遨游东京

已于 2023-08-12 12:11:49 修改

阅读量29

点赞数

文章标签： elasticsearch 大数据搜索引擎

于 2023-08-10 19:57:24 首次发布

本文链接：https://blog.csdn.net/m0_68215555/article/details/132215659

版权

下载文件

Elaticsearch是专门用于解决搜索问题的NoSQL的文档数据库。

无论使用哪种操作系统，只需要下载elasticsearch的压缩包并解压即可使用，需要注意，elasticsearch文件夹的各层级的父级文件夹的名称中不允许包含非ASCII码字符和空格！例如放在D盘根目录下：

执行`bin`目录下的`elasticsearch`即可启用Elasticsearch服务：

启动成功后，效果大致如下：

注意：在使用Elasticsearch的过程中，以上窗口不可关闭！

当启动成功后，你可以通过浏览器访问 http://localhost:9200，页面显示内容如下：

elasticsearch提供了一套基于RESTful的访问，你可以使用任何一种可以提交REST请求的工具来访问elasticsearch及其中的数据，例如常见的测试工具PostMan等。

或者，你也可以在IntelliJ IDEA中，使用HTTP Request进行访问：

在HTTP Request文件中编写需要提交的请求，然后，点击左侧的运行图标即可发起请求

Elasticsearch之所以能够高效处理搜索，是因为它会将你的数据进行“分词”处理，即将一段文本拆成若干个文本，在执行搜索时，会尝试检查是否匹配“拆”出来的某个文本。

向 http://localhost:9200/_analyze 提交请求即可分词，并且，请求中必须包含请求参数，参数名称固定为text，整个请求的格式大致如下：

提示：在同一个`.http`文件中，可以编写多个请求，但是，后续的请求的代码必须使用 `###` 和前序的请求分开，不能只使用1个 `#`！

你也可以尝试对中文的句子进行分词，会发现，在默认情况下，Elasticsearch只能将中文中的每个字拆出来，并不能正确的处理各个词语！

示例代码：

### 测试分词 -- 中文
GET http://localhost:9200/_analyze
Content-Type: application/json

{
  "text": "很高兴认识你！"
}

可以在Elasticsearch中添加新的分词插件来解决以上问题，经典的中文分词插件就是ik分词器。

所有插件都应该放在Elasticsearch下的plugin文件夹下：

你需要将下载得到的ik分词器的压缩包解压出来，将解压得到的文件夹放在`plugins`文件夹下，而ik分词器的文件夹名称就叫`ik`即可：

关注