1、Storm简介
Storm是一个开源的、分布式实时计算系统。能够实现高频数据和大规模数据的实时处理。
2、核心概念
Topology
拓扑,将整个流程串起来
计算拓扑,由spout和bolt组成的;
Stream
流,数据流,水流
消息流,抽象概念,没有边界的tuple构成,一个Stream由多个Tuple构成。
Spouts
产生数据/水的东西
消息流的源头,Topology的消息生产者
Bolts
处理数据/水的东西 水壶/水桶
在Bolt中进行业务处理,其实就是针对Tuple进行处理。消息处理单元,可以做过滤、聚合、查询/写数据库的操作
Tuple
数据/水
消息/数据 传递的基本单元