分布式系统中一个绕不过去的问题是如何协同系统中各个分布的模块,确保系统状态的一致性并完成预期的功能。这里面包括以下几个问题:
- 状态管理:系统应该有一个一致的状态,比如某个模块将某个状态设置为特定值后系统的其它部分能及时(最终)看到一致的状态值
- 分布式锁:在系统需要进行特殊操作室提供锁的语义,保证特殊操作对系统状态改变的一致性
- 服务发现:在大型分布式系统中涉及到如何发现特定服务和资源,这个就牵涉到至少两个问题了
- 如何注册服务或资源(比如端口号)
- 如何发现已经注册的服务和资源:这儿需要特别指出的是,所谓的发现不仅仅是拿到相关服务或资源的访问入口,还包括如何验证这些访问入口的有效性(即如果提供者取消了注册的服务或资源或已经崩溃,这些服务或资源的使用者能有效的发现或收到通知)
现在比较流行的(接触过的)方案是
- zookeeper - 应该是最早的也是使用最广泛的方案了
- etcd - 这个应该是随着kubernetes的流行目前最被关注的方案
- consul - 和etcd一样算是后起之秀,如果说etcd的目的是实现一个更简单的(更好的)zookeeper,consul的野心则要大得多:它尝试提供一个解决分布式系统中常碰到的诸如服务发现,配置管理等等问题的完整解决方案,当然其中也包括基本的分布式状态管理等问题。
(此外还有一些比如由Netflix开发的Eureka等方案,但我并没有接触过)
这几个方案的核心其实都是通过提供了一个一致性的存储来实现上述功能,不同的是