ElasticSearch漫游
文章平均质量分 60
大海捞针 黄沙淘金
——这就是ES
vcaml7717
不要辜负命运的托付
展开
-
ElasticSearch漫游 (12.了解ES集群)
在这种情况下,集群中的节点可能被分为两个或多个孤立的子集群,每个子集群都认为自己是整个集群的唯一有效成员。每个数据节点只处理自己负责的分片数据,这样数据的负载被分散到多个节点上,提供了更好的水平扩展性。在这个过程中,协调节点负责协调查询的分发和结果的合并,而数据节点则负责实际执行查询操作。数据节点只处理属于自己分片的数据,并返回局部结果给协调节点。集群中有很多太机器,每台机器上的ES实例 都有个四个功能,当然你不能集群中每台机器都充当多面手,集群中一般都会界定好每台机器的职责,原创 2023-05-21 21:05:16 · 65 阅读 · 0 评论 -
ElasticSearch漫游 (11.ES数据同步)
mysql管理服务作为生产者发送消息,ES管理服务作为消费者 监听消息,定义两个队列(增改,删除)和交换机绑定。在分布式系统中,源数据管理 和ES搜索服务 一般时完全隔离的,不会将他们耦合在一起, 比如我们有一个数据库管理服务,再有一个ES搜索服务。es的数据的源数据一般会存储再mysql数据库里面 或者数据仓库中,因此源数据发生变化时,es也必须跟着改变。创建队列绑定交换机(这个config既可以放在消费者里面也可以放在生产者里面)那么我们怎么设计数据同步呢?2:binlog监听。原创 2023-05-21 13:36:03 · 467 阅读 · 0 评论 -
ElasticSearch漫游 (10.RestClient 查询文档)
注意sort 和分页 与 query是平级的。原创 2023-05-20 18:37:01 · 25 阅读 · 0 评论 -
ElasticSearch漫游 (9.DSL查询结果处理:排序、分页、高亮)
在上述示例中,你可以根据自己的需求修改"query"部分来定义你的查询语句。第一个条件是按照"field1"字段进行升序排序("asc"表示升序,"desc"表示降序)。你现在分页要查 (100000-10,100000) 这10条数据,如果你直接传100000-10给from, 那么这个from会非常大,影响很多性能。将上述查询请求发送到Elasticsearch进行查询后,返回的结果将按照指定的排序条件进行排序。你可以根据自己的需求添加更多的排序条件,也可以使用不同的排序顺序来满足你的排序需求。原创 2023-05-20 07:47:14 · 297 阅读 · 0 评论 -
ElasticSearch漫游 (8. 进阶 DSL查询 )
整个概念新手可能不太理解相关性算分是基于TF-IDF(词频-逆文档频率)模型和向量空间模型的组合来计算的。它综合考虑了多种因素,包括词频、文档长度、查询词在文档中的位置等。根据这些因素,Elasticsearch为每个文档计算一个相关性得分,表示文档与查询的匹配程度。具体来说,Elasticsearch使用词频(TermFrequency,TF)来衡量查询词在文档中的出现频率。如果查询词在文档中出现得越多,该文档的相关性得分就会更高。但是,它也考虑到词频的归一化,以避免较长的文档在得分上占优势。原创 2023-05-20 01:53:52 · 79 阅读 · 0 评论 -
ElasticSearch漫游 (7.RestClient 操作文档)
前期准备:按照前几篇的内容。原创 2023-05-19 17:56:43 · 66 阅读 · 0 评论 -
ElasticSearch漫游 (6.RestClient 操作索引库)
在 client.indices() 里面有很多方法 创建 删除 判断存在之类的 新手可以去自己看一下 自己敲一遍。执行一下 执行成功。原创 2023-05-19 06:24:27 · 29 阅读 · 0 评论 -
ElasticSearch漫游 (5.RestClient初始化准备)
之前都是在客户端页面各种操作, 但是我们作为一个java开发者,需要使用代码的方式 来操作ES, 所以我们要先从 Rest Client 开始。原创 2023-05-19 05:33:22 · 197 阅读 · 0 评论 -
ElasticSearch漫游 (4.文档操作)
在上一篇中我们已经实践动手 操作了索引库,索引库是结构的定义 也是文档的载体,创建好索引库之后,我们就可以添加具体的文档数据了。原创 2023-05-19 03:06:12 · 31 阅读 · 0 评论 -
ElasticSearch漫游 (3.索引库操作)
它有点类似于mysql里面的表:索引库的操作 也就 有点类似于表操作在Elasticsearch (ES) 中,“索引”(Index)是指一种数据结构,用于存储和组织文档数据的集合。索引库(Index)是Elasticsearch 中的一个核心概念,它类似于关系型数据库中的数据库或表的概念。索引库在 Elasticsearch中用于存储、索引和搜索文档数据。它是由一个或多个分片(shard)组成的逻辑容器。原创 2023-05-19 02:40:49 · 208 阅读 · 0 评论 -
ElasticSearch漫游 (2.认识分词器)
随着社会变化 会出现不断的新词 比如奥里给 比如白嫖 比如只因你太美,这些词汇分词器不认识 这时候怎么办呢?这些拓展和屏蔽的词 只需要在ik分词器目录中的 xml文件中配置就好了。这两个东西很抽象 我写博客的时候 一时间找不到合适的语言表达。发现没有 标准分词器 不认识中文 只能一个一个字的拆。咱们国家有些敏感词是不能出现的 你懂的, 这个怎么办?新手可能会好奇 那你分这个词意义在哪里呢?所以我们在上一篇的安装过程中 安装了ik分词器。在上面的标准分词器 它分英文 分的相当好。分词器允许你拓展字典 词汇。原创 2023-05-18 18:40:24 · 424 阅读 · 0 评论 -
ElasticSearch漫游 (1.安装ELK)
我们需要部署kibana容器,因此需要让es和kibana互联,这里先创建一个网络。ES默认的分词规则对中文的支持比较差,因为他它没有办法有效的区分中文语言的词汇。将ik分词器文件夹 放到这个目录下。至此整个ES就安装成功了。原创 2023-05-18 17:48:38 · 579 阅读 · 1 评论