storm文档(10)----容错

转载请注明出处:http://blog.csdn.net/beitiandijun/article/details/41578517

源地址:http://storm.apache.org/documentation/Fault-tolerance.html


本文主要介绍Storm作为容错系统的设计细节。



当worker死掉时会发生什么?


当worker死掉时, supervisor将重启它。 如果worker启动总是失败,则worker就不能发送心跳消息给Nimbus, 那Nimbus就会重新在另一台machine上启动它。



当node死掉时会发生什么?


分配到这个节点的所有tasks都会超时,那Nimbus会将这些tasks重新分配到另外的机子上。



当Nimbus或者Supervisor daemons死掉时会发生什么?


Nimbus和Supervisor daemons都是设计为快速失败的(任何意外状况发生时都可能导致进程自身崩溃)以及无状态的(所有的状态都是保存在Zookeeper或者Disk上)就像在配置storm集群中描述的一样, Nimbus和Supervisor daemons必须运行在监控之下,这个监控是使用诸如daemontools或者monit等工具实现的。因此,如果Nimbus或者Supervisor daemons死掉的话, 他们会像什么都没发生一样再次重启。


最需要指出的是, 没有worker进程会受到Nimbus或者Supervisors死掉的影响。 而相比之下,对Hadoop来说, 如果JobTracker死掉的话, 所有运行的jobs都会丢失。



Nimbus是否会出现单独失败的状况?


如果Nimbus 节点死掉的话, worker依然会运行下去。另外, supervisors在它们死掉的时候依然会重启。尽管如此, 没有Nimbus, worker 在需要时(比如worker所在机器宕机时)不会重新分配到其他机器上。


因此,答案就是Nimbus是某种单一故障点。实际中,Nimbus daemon死掉时, 也不是什么大事,因为不会发生什么灾难性的事情。未来还有一些计划用来提交Nimbus可用性。



Storm怎样保证数据处理?


Storm提供保证数据处理的机制, 即使节点死掉或者丢失消息时也可以保证。更多细节可以查看   保证消息处理机制












评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值