理解Zookeeper

最新推荐文章于 2024-08-22 19:51:16 发布

magina_lil

最新推荐文章于 2024-08-22 19:51:16 发布

阅读量2.5k

点赞数 1

分类专栏： hadoop 文章标签： zookeeper hadoop

本文链接：https://blog.csdn.net/magina_lil/article/details/50056929

版权

hadoop 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

Zookeeper在yarn和hdfs中的HA

zookeeper会对ResourceManager和NameNode节点相关进程进行监控,他们之间一直在通信,当zookeeper发现RM和NM挂掉的时候,就会通过选举的方式选举另外一个节点对外提供服务,把standby改为active

分布式锁
Zookeeper是一个分布式协调服务。这样我们就可以利用Zookeeper来协调多个分布式进程之间的活动。比如在一个分布式环境中，为了提高可靠性，我们的集群的每台服务器上都部署着同样的服务。但是，一件事情如果集群中的每个服务器都进行的话，那相互之间就要协调，编程起来将非常复杂。而如果我们只让一个服务进行操作，那又存在单点。通常还有一种做法就是使用分布式锁，在某个时刻只让一个服务去干活，当这台服务出问题的时候锁释放，立即fail over到另外的服务。这在很多分布式系统中都是这么做，这种设计有一个更好听的名字叫Leader Election(leader选举)。比如HBase的Master就是采用这种机制。但要注意的是分布式锁跟同一个进程的锁还是有区别的，所以使用的时候要比同一个进程里的锁更谨慎的使用。

zookeeper通过协议可以保证在同一个路径下只有一个相同的文件,创建znode节点只有一个能成功,谁创建成功谁就是active状态,standby不对外提供服务.但是他们对外提供同一命名空间

Zookeeper中写操作流程的用处

当Active状态的Namenode元数据发生改变时，Active NameNode 的EditLog 日志文件写入共享的JournalNode（ZooKeeper集群中）中，只要超过一半写入成功，Zookeeper就会认为它写成功了，其它节点会同步更新日志文件，然后呢，standy NameNode 就开始读取这个日志文件，保存与Active NameNode信息同步，一旦Active NameNode挂掉了，另外一个有着同样元数据信息的NameNode会启动，对外提供服务。

datanode向active和standby状态的NameNode都提交请求,但是只有active的NameNode的才能向journalnode中写数据.standby只能从journalnode中读数据

journalnode一般也是奇数个,客户端写数据时,元数据写到journalnode(类似于一种小集群),超过一半成功,NameNode才返回给client成功