Storm计算基本机构
本篇包含以下几点:
strom topology 的基本组成补分;
搭建storm开发环境;
实现单词技术程序;
并发和容错机制;
第一:storm topology 的基本组成部分:stream ,spout ,和bout;
storm分布式计算机构称为topology;由stream(数据流) ,spout(数据生产者) ,和bout(运算)组成;
storm topology 大致等同于Hadoop这类批处理运算中的Job,可是,批处理运算中的Job对运算的起始和终止有着明确的定义!
Storm topology 会一直运行下去!除非进程被Kill掉或者被取消部署!
Stream--数据流:
Storm核心数据结构是tuple , tuple是包含了一个或者多个键值对的列表,Stream是由无限制的tuple组成的序列!
spout 代表了一个storm topology的主要数据入口;