ElasticSearch初探之所有初次使用记录（八）关于ES集群master选举的几个关键参数的小测验

haixwang

于 2018-05-20 22:13:12 发布

阅读量1w

点赞数 3

分类专栏： ELK Stack ELK Stack

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/HaixWang/article/details/80383942

版权

本文详细探讨了ElasticSearch集群中master选举的关键参数，包括`discovery.zen.ping_timeout`，`node.master`和`discovery.zen.minimum_master_nodes`。通过一系列的测试，阐述了这些参数如何影响集群的稳定性和选举过程，如节点启动顺序、选举条件等。测试结果显示，合理设置参数对于避免master节点选举失败至关重要。

摘要由CSDN通过智能技术生成

环境：5台安装elasticsearch-5.6.8centos6.9的机器

~5节点的discovery.zen.minimum_master_nodes: 的值都设置为3时，依次启动每台机器，启动不了任何一个节点，因为最先启动的节点发觉它启动的时候没有master节点，即使是它有成为master的资格，但是因为此时集群中没有其他节点为它“投票”[非zookeeper实现]，所以启动失败；【但是discovery.zen.ping_timeout设置大一点时可以的】
说起来有些抽象，还是换个思路，先说参数，再说参数设置。~

参数解释

几个关键的参数

1.discovery.zen.ping_timeout
2.node.master
3.discovery.zen.minimum_master_nodes
配置时，冒号后面一定要得有空格

discovery.zen.ping_timeout

discovery.zen.ping_timeout：（默认3秒）。关于这个参数，我有话要说：不少人说是ping的超时时间，朋友们不要看到“timeout”就想到ping不通超时好不好！很误导人的。另外，以下结论仍不够完整或不完全正确，还有很多不解之处，感兴趣的朋友可以看看源码。欢迎留言交流，批评指正。
1. 首先，这个参数与master的选举是有很大关联的。在这个时间段中，节点有可能作为slave加入到集群中也有可能被选举为主节点。ping的回调函数需要等待discovery.zen.ping_timeout 这个配置对应的时间才会返回。
2. ZenDiscovery类的findMaster开头有这么一句，选主方法调用开始的地方。
  ZenPing.PingResponse[] fullPingResponses = pingService.pingAndWait(pingTimeout);
  从源代码角度寻求这个答案，参考[1]
3. 这里我们考虑下这样的情况：现在挂点的节点正好是之前的master，这个时候它要加入，但是有可能它恢复得过快，挂掉后立马请求加入集群，这个时候集群还没有选举出新的master，当主节点停止或遇到问题时，群集节点会再次启动ping并选择新的主节点。
4. 在作出选举决定之前，三秒可能不足以让节点意识到其环境中的其他节点。在这种情况下，应该谨慎地增加超时时间，因为这会减慢选举进程。一旦一个节点决定加入一个现有的已形成的集群，它将发送一个加入请求给master，（discovery.zen.join_timeout）默认值是ping_timeout的20倍。
5. 所以discovery.zen.ping_timeout 这个参数设置比较大，可以减少master因为负载过重掉出集群的风险。但同时如果master真出问题了，重新选举过程会很长。
6. TODO:什么时候ping?这里的ping与其他大数据解决方案的心跳报告有联系吗？官方说:ping_interval:How often a node gets pinged. Defaults to 1s.
7. 有人说，选举master时，node.master为false的节点的投票是不起作用的，这个说法不完全正确：如果discovery.zen.master_election.ignore_non_master_pings设置为true，那么以上说法正确，但是默认是false，也就是说，它们的投票是起作用的，只是它们不可能成为master。所以我觉得，集群机器数不大的话，除了负担特别重的机器，都设置为node.master为true比较妥当。
8. 当主节点停止或遇到问题时，群集节点会再次启动ping并选择新的主节点。
9. 选举master的时候，会连续发送3次ping测试，顺序是这样的:
  - 发送第一轮ping
  - shedule第二轮ping，间隔为1/2 timeout时间
  - schedule第三轮 ping，间隔为 1/2 timeout时间。
  - 第三轮sendpings传递了waitTime参数，其值也是1/2 timeout时间，用于设置countdown latch await时长。如果对每个node的ping测试很快顺利完成，latch countdown应该也是瞬间的，这里几乎没有什么耗时。
  - 通知listener结果，结束选主过程。

node.master

见上小节的第7点。

discovery.zen.minimum_master_nodes

设置需要加入新一轮master选举的“master”候选人的最小数量
也就是说，集群中，该值是针对那些node.master=true的来设置的，建议>=num(node.master

最低0.47元/天解锁文章

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。