微博在构建基于Docker容器的混合云架构时,采用了Consul架构进行集群的节点发现和业务的服务发现,当使用Nginx作为代理的时候,只需要在upstream的配置中声明Consul集群,即可完成后端服务的动态发现。在这样一种服务发现的模式中,Consul处于系统的核心地位,一旦它出现问题就会导致整个集群的失联,由此可见在Consul架构的设计中,分布式高可用性是最基本要求。下面具体阐述Consul的分布式架构与其使用的一致性协议和通信协议:
1 架构
一个Consul的典型架构图如下所示:
首先介绍一下其中的几个相关概念:
l Agent: Consul集群中每个成员节点上都必须运行的守护进程,有Client和Server两种模式,所有的Agent都可以调用DNS或HTTP API,并负责检查和维护服务同步。
l Client: 指集群中运行Client模式Agent的节点,它将所有的RPC转发到Server。
l Server: 指集群中运行Server模式Agent的节点,参与Raft协议,包括Leader选举、心跳同步等。Server维护集群的状态,响应RPC查询,与其他数据中心通过WAN Gossip交互,将查询转发到Leader或远程数据中心。
l 数据中心(Datacenter): 指在同一个私有的、低延迟、高带宽的网络环境中的一组网络基础设施,官方建议[1]一个Consul的数据中心包含3到5个Server(为了故障处理和性能的平衡)和N多个Client。
Consul允许多数据中心,数据中心之间是低耦合的,但由于故障检测、连接缓存和复用机制,跨数据中心的请求响应通常十分快速和可靠。Consul采用基于Raft算法的一致性协议进行Leader选举和事务管理,采用基于Gossip算法的通信协议进行通信和成员管理。