一、术语
Nimbus :storm集群主节点。负责资源分配和任务调度
supervisor:工作节点,接受nimbus分配任务,管理worker
woker:supervisor下面的工作进程,具体任务执行
topology:计算拓扑,由spout和bolt组成的图状结构
spout:storm编程中的消息源
bolt:storm编程中的处理组件
stream:拓扑中的消息流,传输的对象是tuple
tuple:一次消息传输的基本单元,多个tuple组成stream
stream groupings 数据流分组策略:
1)shuffle 随机分组:保证bolt接受的tuple数据相同
2)Fields 按字段分组:相同tuple会分到同一个bolt中
二、storm集群架构
nimbus【仅一台,坏掉就不能管理啦】
zk【一般3台,和后面的supervisor在一起】
多个supervisor
每个supervisor包含多个worker,每个worker包含多个task,这里的task是逻辑线程,即可能多个task为一个线程
三、拓扑
编程基本就是在对拓扑来进行编辑