1、Storm进程容错性
Storm有几个不同的守护进程,nimbus安排工人发射和杀死worker的supervisors,允许访问日志的日志查看器,以及显示群集状态的UI。
1.1、worker死掉了怎么办?
当worker死亡时,supervisors会重新启动他,如果连续启动失败,并且无法像nimbus发射心跳信息,nimbus将从新安排工作进程
1.2、当一个节点死亡时会发生什么?
分配给该机器的任务将超时,nimbus会将这些任务重新分配给其他机器
1.3、当nimbus或supervisor守护进程死亡会发生什么?
nimbus和supervisor守护进程被设计成故障快速恢复,每当遇到任何意外情况进程都会自毁和无状态,所有状态太都保存在zookeeper或者磁盘上,nisbus和supervisor守护进程必须使用daemontools或者monit之类的工具监视下运行,如果nisbus和supervisor的守护进程死掉,会和什么都没发生一样重新启动
1.4、nimbus或者supervisor死亡不会影响任何worker进程
1.5、nimbus时单点故障吗?
如果失去Nimbus节点,worker仍将继续工作。如果worker死亡,supervisor将继续重新启动工人。然而,如果没有Nimbus,worker将不会在必要时被重新分配到其他机器(比如如果你失去了一台辅助机器)。
2、Storm的ack和fail机制