1. 作用
- Zookeeper的设计核心目的:在分布式系统中
协作
多个任务。- zookeeper是一个用来进行分布式服务管理的
协调组件
。
- zookeeper是一个用来进行分布式服务管理的
- 分布式系统中存在的问题:
- 各个服务的状态(存活,执行的任务等)跟踪与管理。
- 不同服务间的元数据同步问题。
- 分布式系统的并发问题。
- zookeeper本身不是直接解决这些问题,而是它
本身的特性
,可以让zookeeper 的使用者,根据自己的需求对Zookeeper提供的特性进行应用,最终解决分布式系统中,多个任务协作的问题。
2.应用
- Apache Hbase
- 在Hbase中,Zookeeper用于
选举
一个集群内的主节点
,以便跟踪可用的服务器
,并保存集群的元数据
,
- 在Hbase中,Zookeeper用于
- Apache Kafka
- Kafka是一个基于发布订阅模型的消息系统。其中Zookeeper用于
检测崩溃
,实现主题(topic)的发现
,并保持主题的生产和消费状态
。
- Kafka是一个基于发布订阅模型的消息系统。其中Zookeeper用于
- Apache Solr
- Solr的分布式版本命名为SolrCloud,它使用Zookeeper来
存储元数据
,并协作更新这些元数据
。
- Solr的分布式版本命名为SolrCloud,它使用Zookeeper来
3.补充
- 分布式系统定义:
+ 同时跨越多个物理主机,独立运行的多个软件组件所组成的系统。 - Zookeeper不适用场景:
- 海量数据的存储,Zookeeper的单个节点下的存储数据是限制在1M左右(Zookeeper存储的数据是分布式间的
协同数据
,而不是应用数据
)。 协同数据
:对比前面的Apache Solr的集群应用,在配置SolrCloud 时,会将solrconfig.xml配置文件上传至zookeeper管理,这样在集群中的solr应用,使用的都是同一份配置数据,并且变更也是同步的,这样的数据就称之为协同数据。应用数据
:同比就是solr的索引文件。
- 海量数据的存储,Zookeeper的单个节点下的存储数据是限制在1M左右(Zookeeper存储的数据是分布式间的
- 分布式系统的通信:
- 通过网络直接进行信息的交换。
- 读写某些共享存储(zookeeper)。
- 就共享存储而言,本身也是需要在进程和存储间进行网络通信。
PS:在后面的博客中会分享zookeeper提供的特性,以及这些特性是怎么解决列出的这些分布式中的问题的。~欢迎留言交流与指出问题~