storm集群的容错机制

 

正常运行的Storm集群,如果nimbus、supervisor、worker出现挂机,会怎么样?

1、worker进程死亡

如果所运行的任务的worker进程死亡,supervisor会尝试重启worker进程,如果尝试多次后依然无法启动,那么nimbus会重新分配一个supervisor来执行该任务。

2、supervisor所在的机器宕机

如果supervisor所在的机器宕机,首先会将分配给该机器的任务暂停,并且nimbus会重新分配机器来执行该节点上的任务。

3、nimbus或supervisor进程死亡

在Storm设计中,nimbus和supervisor都是独立的进程,和执行业务逻辑的worker完全分离,那么,nimbus和supervisor的进程死亡,对于Storm任务而言,没有任何的影响。

只是,我们需要在服务中对nimbus和supervisor的进程进行运维监控,如果发现进程死亡,需要及时的进行再重启,否则无法增加新的任务。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值