rabbitmq autoheal机制简析

匿名冲浪中

已于 2022-09-06 15:33:15 修改

阅读量1.4k

点赞数 5

文章标签： rabbitmq 分布式

于 2022-09-06 15:21:44 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40749404/article/details/126726069

版权

autoheal：即rabbitmq在发生网络分区后的恢复机制
恢复逻辑分为四步：

1.选出获胜的网络分区。

评价标准：客户端连接数，相同再看节点数目，如果都相同则用其他方式挑选（参数输入的顺序)

2.停掉其他分区的节点

3.等待全部停止

4.启动上述节点

涉及到的角色及选取方式：

leader — 集群中任意选取的节点，用来主导autoheal的公正角色。可能在获胜分区，也可能在失败分区被重启

winner — 获胜的分区中选出来的一个节点，负责重启节点

losers — 失败分区中的节点，待重启

ps：leader可能持续受到新的autoheal请求，但是全部会被忽略，直到winner通知leader当前的autoheal流程结束或者已经终止，或者是与winner断开了连接

可能的状态：

not_healing — 默认状态

{winner_waiting, OutstandingStops, Notify} — winner，等待所有失败节点停止，随后将通知他们重启

{leader_waiting, Winner, Notify} — leader，已经指定了winner和losers，等待winner通知autoheal是否结束了

restarting — 重启中

消息流：

Any node (leader included) >> {request_start, node()} >> Leader

当Mnesia检测出集群出现分区，则从集群中找到第一个节点作为leader节点进行autoheal操作

Leader >> {become_winner, Losers} >> Winner

Leader决策出winner和losers，并且通知winner

Winner >> {winner_is, Winner} >> All losers

winner通知losers启动新进程用于rabbit的重启

Winner >> autoheal_safe_to_start >> All losers

winner发现所有losers已经停止或者autoheal 流程终止，通知losers可以重启rabbit

Leader >> report_autoheal_status >> Winner

在leader为loser时，leader因为重启，会主动发送该请求给winner，看是否autoheal结束了

Winner >> {autoheal_finished, Winner} >> Leader

winner告知leader，autoheal已经结束

autoheal 引发的问题

重启的节点如果持续连不上winner，在尝试10 * 30s * 2后，将重启失败，导致一些持久化的队列出现异常

在间歇性网络故障发现过该问题，通过脚本检测日志进行修复

匿名冲浪中

关注

5
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

匿名冲浪中

博客等级

码龄7年

12
原创

111
点赞

107
收藏

86
粉丝

关注

私信

热门文章

最新评论

从rabbitmq订阅流程看消费者丢失问题
普通网友: 这篇文章是优质之作，内容充实，结构明晰，语言流畅且通俗易懂，适合广大读者阅读。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
rabbitmq可靠消息投递：mandatory与publisher confirm
普通网友: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
rabbitmq可靠消息投递：mandatory与publisher confirm
普通网友: 引领技术潮流，是不可多得的好文，十分值得借鉴和参考。期待博主未来能够持续分享更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
rabbitmq集群故障： Application rabbit exited with reason: {{incompatible_feature_flags
CSDN-Ada助手: 恭喜您写了第8篇博客！对于rabbitmq集群故障的探讨让人受益匪浅。关于“Application rabbit exited with reason: {{incompatible_feature_flags”，我想说您的分析非常深入，对于解决这类问题有很大帮助。希望您可以继续分享关于rabbitmq集群故障的解决方案，或者可以尝试探讨其他相关的主题，比如常见的运维问题或者技术案例分析等。期待您的下一篇作品！
rabbitmq三节点下集群恢复模式及分区问题
CSDN-Ada助手: 恭喜作者对rabbitmq三节点下集群恢复模式及分区问题进行深入探讨，文章内容十分有价值。希望作者能够继续分享更多关于rabbitmq集群的实践经验，或者可以考虑深入研究其他消息队列系统的比较分析，这样可以为读者提供更全面的参考。谢谢作者的分享，期待更多精彩的内容！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。