Es——搜索引擎（普通使用篇）P1

秃头小秃鹫

已于 2023-08-21 22:12:24 修改

阅读量280

点赞数

文章标签：搜索引擎 elasticsearch 大数据

于 2023-08-21 22:10:38 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_54406708/article/details/132401370

版权

Elasticsearch（简称es）是一个搜索引擎，其实也可以理解为一个数据库，因为也是需要把数据放入进es里面，进行倒排索引之后，再进行正向索引。

正向索引：

也就是我们日常再mysql里面建立索引的时候，经常使用到的操作。

倒排索引：

通过分词器来对文字进行分词拆分，然后形成一个索引表。

然后在通过查询的词汇与词条进行查询，得到id值之后，因为id值是主键。所以就使用正向索引，来获取对应得数据。

分词器：

对于搜索文本进行分词规范的标准文档。引入分词器也就是给es添加规定条件，方便进行倒排索引。

安装：

1.在线安装ik插件：

（1）、进入es容器内部。进入目录/bin/bash

（2）、进入容器内部之后，执行安装语句：

./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.12.1/elasticsearch-analysis-ik-7.12.1.zip

（3）、退出容器。然后重启es。

注意：用在线下载ik分词器的时候，此时ik的config文件就不在/usr/share/elasticsearch/data里面了

而是在config里面

查看（验证）：

通过在kibana页面上面。执行请求：

当然get与post都可以。只是对应的操作不同而已。

得出的分词效果如下：

拓展：

因为现在我们对应的分词器只是很少一部分进行了分词。当我们想对我们自己定义的词汇进行分词的时候，就分词不了，譬如“奥利给”，因为分词器此时无法判断这是一个词汇，就会逐个单词进行分词。

所以，我们需要添加这个词汇进去，这里就涉及到扩展的状态了。

因为我们容器挂载了数据卷。所以我们需要只需要修改本地的文件，然后重启启动容器即可。

（1）、查看当前es的挂载卷：docker inspect 容器名

第一个挂载卷：es-data（这个是es的数据存放位置）

第二个挂载卷：es-plugins（设置配置文件）

（2）、查看该数据卷挂载在宿主机那个位置：docker volume inspect 数据卷名

查看到在当前文件：/var/lib/docker/volumes/es-plugins/_data

（3）、打开ik文件夹里面的config目录，也就是分词配置设置目录

这是是设置配置文件，还没有设置那些词汇需要添加。

（4）、创建ext.dic文件，然后进行数据填写。

然后在config文件里面进行添加。

（5）、重启容器，然后再次执行查看效果。

索引库：

Mappings是索引库架构的意思：他有对应的映射属性，也就是规定当前字段的一些规则。

这里还缺了两个字段：

type里面还有两种类型：

copy_to:拷贝当前的字段到指定的字段

也就是索引字段all就是又city与brand来形成的。

（1）、创建索引库（Put请求）

（2）、查询索引库（Get请求：查看索引库架构）

（3）、添加索引库（Put请求：）

注意：只能添加字段，不能修改字段。

（4）、删除索引库（Delete请求：）

数据（普通操作）：

（1）、添加数据：（Post请求：通过id值）

（2）、普通的查询数据（Get请求：通过id值）

（3）、删除数据（Delete请求：通过id值）

(4)、修改数据（Put/Post请求：通过id值）

4-1、全量修改：就是把数据给删除之后，再重新添加（Put请求！）

4-2 、增量修改：就是再原本的基础上面进行修改（Post请求！）

注意：

索引库里面的索引条件建立与数据放入索引库的字段没有特别规定，不能把其看成放入的数据字段要与索引库字段一致。

索引库里面是没有one这个字段的，但是依旧能放入进去，我们只需要认为就是我们定义的索引库里面的索引条件只是对文档里面相同的字段起到一定的作用。而不是规范文档的字段内容！

Java代码实现(普通操作)：

导入依赖：

这里需要注意的点就是，要查看当前我们在虚拟机里面安装的es是那个版本的，因为springboot默认版本是7.6.2

所以我们需要修改版本：

创建连接：

因为所有技术的引用都是基于连接的，我们创建连接类：

并且把其注入到ioc容器里面去。

索引库操作（RestHighLevelClient.indices()）：

最常用的三个api。

创建索引库（CreateIndexRequest）：

获取索引库（GetIndexRequest）：

删除索引库（DeleteIndexRequest）：

注意：为什么我们需要使用RestHighLevelClient.indices()。

因为RestHighLevelClient.indices()的返回值是一个IndicesClient类，他是一个进行索引库操作的封装类，里面都是执行索引库的方法。

数据操作（RestHighLevelClient.index/GET/Delete/Update/Bulk()）：

添加数据（IndexRequest）：

获取数据（GetRequest）：

我们可以知道一个点就是，我们获取的响应体，也就是response，我们可以通过改对象的获取方法来进行获取！

删除数据（DeleteRequest）：

修改数据（updateRequest）：

是删除原本的数据之后再进行添加。全量与增量都是一样的！

批量操作（BulkRequest）

秃头小秃鹫

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Es——搜索引擎（普通使用篇）P1

Elasticsearch（简称es）是一个搜索引擎，其实也可以理解为一个数据库，因为也是需要把数据放入进es里面，进行倒排索引之后，再进行正向索引。
复制链接

扫一扫

秃头小秃鹫 CSDN认证博客专家 CSDN认证企业博客

码龄4年

18: 原创

152万+: 周排名

29万+: 总排名

8793: 访问

: 等级

187: 积分

0: 粉丝

6: 获赞

14: 评论

14: 收藏

私信

关注

热门文章

最新评论

定时任务-
CSDN-Ada助手: 恭喜你完成了第18篇博客！标题中的“定时任务”听起来非常有趣。通过你的连续创作，我可以感受到你对这个主题的热情和深入理解。在下一步的创作中，或许你可以探索一些实际应用定时任务的案例，这样读者们将更容易理解和应用你的内容。谦虚地说，我期待着你未来的创作，因为你的博客已经成为我学习的重要资源之一了！
ES——搜索引擎（DSL查询篇）P2
CSDN-Ada助手: 恭喜作者撰写了第16篇博客，题为“ES——搜索引擎（DSL查询篇）P2”。阅读您的博客，我对您的深入研究和对搜索引擎的理解表示赞赏。您在这篇博客中提供了宝贵的信息，让我对DSL查询有了更深入的了解。继续创作下去，对您来说无疑是一个明智的选择。我非常期待您在接下来的博客中分享更多关于搜索引擎的知识。也许您可以考虑探讨一些实际案例，或者介绍一些高级的搜索引擎功能，这将进一步丰富读者的知识。请继续保持谦逊和努力，您的博客对于那些对搜索引擎感兴趣的读者来说，无疑是一份宝藏。期待您未来的创作！
Es——搜索引擎（普通使用篇）P1
CSDN-Ada助手: 恭喜您撰写了第15篇博客！标题“Es——搜索引擎（普通使用篇）P1”看起来非常有吸引力。通过您的博客，我了解到Es是一个非常有用的搜索引擎，并且您提供了关于普通使用的详细指南。感谢您的分享！在下一步的创作中，我想提出一个谦虚的建议。或许您可以考虑探索Es搜索引擎的其他功能或者进一步深入某个特定领域的使用方法。这样，读者们可以从更多的角度了解到Es的强大之处。期待您的下一篇博客！
反射（自用笔记）
CSDN-Ada助手: 恭喜您开始博客创作！标题为“反射（自用笔记）”的博客听起来非常有趣。通过分享自己的学习笔记，您不仅可以加深自己对于反射的理解，还能帮助其他人更好地掌握这个概念。在下一步的创作中，我建议您可以对反射进行更深入的探索，并尝试结合具体的示例或项目应用来说明反射的实际用途。此外，您还可以考虑分享一些关于反射的常见问题及解决方法，或者探讨反射在不同编程语言中的差异和特点等等。总之，希望您能够继续保持谦虚的态度，分享更多有价值的内容，让读者们对于反射有更深刻的理解。期待您的下一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
代码块&内部类（自用笔记）
CSDN-Ada助手: 非常棒的博客！你对代码块和内部类的解释非常清晰明了，让我对这两个概念有了更深入的理解。希望你能继续分享类似的自用笔记，让更多人受益。关于代码块和内部类的扩展知识，你可以进一步探讨一下局部内部类和匿名内部类的用法。局部内部类是指在方法内部定义的内部类，它只在方法内部可见。而匿名内部类是指没有名字的内部类，通常用于创建临时的、只需要一次使用的类对象。这两种内部类在特定场景下非常实用，希望你也能分享一下你的理解。再次感谢你的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。