十三、es集群

最新推荐文章于 2024-03-24 14:14:38 发布

喵了个咪的回忆丶

最新推荐文章于 2024-03-24 14:14:38 发布

阅读量453

点赞数

分类专栏： es 文章标签： elasticsearch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dl674756321/article/details/120251329

版权

es 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

一、集群、分布式的概念和作用

在这里插入图片描述

三个红框彼此构成集群
每个红框内部构成分布式
合起来就是集群分布式架构

二、es集群的特点

es天然支持分布式
es的设计隐藏了分布式本身的复杂性

三、es集群分布式架构的相关概念

集群（cluster）：一组拥有共同的 cluster name 的节点
节点（node）：集群中的一个es实例
索引（index）：es存放数据的地方，相当于关系数据库中database的概念
分片（shard）：索引可以被拆分为不同的部分进行存储，称为分片。在集群环境下，一个索引的不同分片可以拆分到不同的节点中。
主分片：es会将数据分为多个分片，然后分别存放在不同的es节点中
副本分片：每个主分片可以有多个副本，数据和主分片意义。在存放副本分片时，副本分片并没有跟着自己对应的主分片放在同一节点中，而是错开放置的，这样做的意义是即使某个es节点挂了，其他节点也能完整获取es的数据。

在这里插入图片描述

四、es集群管理

在创建索引时，如果不指定分片配置，则默认主分片1，副本分片1
在创建索引时，可以通过settings设置分片

# 创建索引，设置分片
PUT test_shard_index
{
  "settings": {
    "number_of_shards": 3,
    "number_of_replicas": 1
  },
  "mappings": {
    "properties": {
      "name":{
        "type": "text"
      }
    }
  }
}

“number_of_replicas” : 1 ，表示每个主分片都有1个备份分片。
如果某个节点挂了，es会把这个节点剔除出去，并将里面的分片自平衡到其它节点中。
es中每个查询在每个分片的单个线程中执行，但可以并行处理多个分片。
分片数量一旦确定，不能修改
索引分片推荐配置方案：
- 1、每个分片推荐大小 10~30GB，分片太小的话会导致每个分片存的数据量不大，从而使分片数增多，在查询时会影响效率；也不能设置的太大，因为在分片中是单线程执行的，分片过大会导致这一个分片上占用的时间太多。
- 2、分片的数量 = 节点的数量 * 1~3倍
- 3、举例：有1000GB的数据，可以分为40个分片，20个节点。

五、集群原理——路由原理

es的路由指：文档存入对应的分片，es计算分片编号的过程
es如何知道一个文档应该存到哪个分片中？（通过路由算法）
查询时，根据文档id查询文档，es如何知道去哪个分片中查询数据？（路由算法）
路由算法：shard_index = hash(id) % number_of_primary_shards
为什么es不让更改分片的数量？因为es分片的数量一旦改了，那所有的文档数据都需要打乱了，重新的往不同的分片里存储，对es性能的损耗是比较大的。（可以重建索引来更改分片数量）

六、脑裂

一个正常的es集群中只有一个主节点（master），主节点负责管理整个集群，比如创建或删除索引、决定分片分配给相关的节点
脑裂问题的出现是因为从节点在选择主节点上出现分歧而导致一个集群出现多个主节点的现象，这会导致集群分裂，处于异常状态。

产生的可能原因：

1、网络原因：网络延迟

一般es集群会在内网部署，也可能在外网部署，比如阿里云
内网一般不会出现此问题，外网的网络出现问题的可能性大些

2、节点负载

主节点的配置：node.master: true（是否有资格成为主节点），node.data: true（是否存储数据），这样配置后主节点既为master又为data，当数据量访问比较大时，可能导致master节点停止响应（假死状态）。

3、JVM内存回收

当master节点设置的JVM内存较小时，在引发JVM大规模内存回收时，可能导致es进程失去响应。

避免脑裂的方法：

网络原因：discovery.zen.ping.timeout 超时时间配置大一点。默认是3s，比如改为10s
节点负载：角色分离。将候选主节点配置为：node.master: true，node.data: false；数据节点配置为：node.master: false，node.data: true
JVM内存回收：修改 config/jvm.options 文件中的 -Xms 和 -Xmx 为服务器内存的一半。

喵了个咪的回忆丶

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
十三、es集群

一、集群、分布式的概念和作用三个红框彼此构成集群每个红框内部构成分布式合起来就是集群分布式架构二、es集群的特点es天然支持分布式es的设计隐藏了分布式本身的复杂性三、es集群分布式架构的相关概念集群（cluster）：一组拥有共同的 cluster name 的节点节点（node）：集群中的一个es实例索引（index）：es存放数据的地方，相当于关系数据库中database的概念分片（shard）：索引可以被拆分为不同的部分进行存储，称为分片。在集群环境下，一个索引的不
复制链接

扫一扫

专栏目录

喵了个咪的回忆丶 CSDN认证博客专家 CSDN认证企业博客

码龄6年

446: 原创

4万+: 周排名

92万+: 总排名

31万+: 访问

: 等级

6189: 积分

214: 粉丝

133: 获赞

31: 评论

557: 收藏

私信

关注

热门文章

分类专栏

最新评论

前中后序遍历，层次遍历（递归和非递归法）
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)提升标题与正文的相关性；(3)使用更多的站内链接。
redis分布式锁
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。
索引（B+树）、B+树一个节点有多大？（一千万条数据，B+树多高？）
Mayfly_may_fly: 很棒，现在的课堂就是不直观，不会拿出实际例子，尽是些抽象概念。
进程上下文切换；用户线程、内核线程
兵无常形1: 这说的应该是用户级线程，内核级线程。内核线程是另一个东西
2.2 JVM中堆和栈的区别
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加条理清晰的目录；(3)文章不宜太短。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。