Storm流式计算:
storm是个实时的分布式计算系统,可以接收无限的数据流
核心概念:
Topology:Storm集群中运行的程序。相当于hadoop中的job
Nimbus:负责分配任务
Spout:中文表示水龙头,接收外界传来的数据,相当于flume中的source,调用nextTuple函数,发射供Bolt消费
Bolt:接收Spout传来的数据,传递给另外的Bolt,bolt接收消息,调用executor
Tuple:表示信息的传递单位
Stream分组:spout传递数据 的规则