1 Storm是Twitter 公司孵化的产物,该项目创建者Nathan Marz Storm描述为“实时的Hadoop”,
Apache Storm是一个免费、开源的分布式实时计算系统
2 Nathan首先提出将“流(Stream)”作为一个分布式的抽象概念,然后又提出了“spouts”和“bolts”的想法,前者生成全新的流,而后者以流作为输入,并生成流作为输出。Bolts只需订阅它们需要处理的流,并指明作为输入的流应该如何划分。最后,他提出了最上层的抽象概念“拓扑(Topology)”,它是一个由spouts和bolts组成的网络。
spout 喷口,喷嘴; 水柱,喷流; (鲸类的) 喷水孔; [气] 龙卷;
bolt 闪电,雷电; 螺栓,螺钉
topology 拓扑结构; 地质学; 局部解剖学
3 数据的实时分析,持续计算,分布式RPC (remote procedure call protocol)
4 BaseRichSpout(消息生产者)
BaseBasicBolt(消息处理者)
TopologyBuilder(拓扑的构建器)
Values(将数据存放到values,发送到下个组件)
Tuple(发送的数据被封装到Tuple,可以通tuple接收上个组件发送的消息)
Config 配置
StomSubmitter /LocalCluster 拓扑提交器