开发组件:
Storm 集群和hodoop集群看起来类似,但是hadoop上运行的是mapreduce jobs ,而在storm上运行的是拓扑topology ,两者之前的区别是mapreduce jobs 运行完程序(离线数据)之后会结束,而topology不会结束(实时数据),除非手动kill,或者出现异常。
Storm 集群由一个主节点nimbus和一群工作节点 supervisor组成,通过zookeeper行动协调。
1)nimbus主节点:相当于hadoop 的JobTracker、yarn的ResourceManager,主要进行计算任务分配信息,哪些worker启动在哪些supervisor上,哪些worker运行那些线程上来执行task。
2)supervisor工作节点:相当于hadoopr的TaskTracker、yarn的NodeManager,负责接受nimbus分配的任务,启动或关闭属于自己管理的worker,每个工作节点都是topology的一个子集的实现,nimbus 和supervisor之间通过zookeeper集群进行协调。
3)zookeeper 集群:是完成nimbus和supervisor之间的