这篇文章概述了由于集群中的大多数服务器节点丢失而从Consul中断中恢复的过程。中断类型有几种,具体取决于服务器节点的数量和发生故障的服务器节点的数量。我们将概述如何从以下方法恢复:
单个服务器集群发生故障。这是当您只有一台Consul服务器并且失败时。
多服务器集群中少数服务器发生故障。
多服务器群集中的多台服务器出现故障。
单台集群服务器故障
如果只有一台服务器并且发生故障,只需重新启动它即可。单个服务器配置需要-bootstrap
或-bootstrap-expect=1
标志。
consul agent -bootstrap-expect=1
如果无法恢复服务器,则需要使用部署指南启动新服务器。
在单个服务器集群中出现不可恢复的服务器故障并且没有备份过程的情况下,由于没有将数据复制到任何其他服务器,因此数据丢失是不可避免的。这就是为什么从不建议部署单个服务器的原因。
当新服务器上线时,由于代理执行反熵,将重新填充在代理中注册的所有服务。
少数服务器故障
如果发生故障的服务器是可恢复的,最好的选择是使其恢复联机状态,并使其重新加入具有相同IP地址的几区。这