storm流式框架
Apache下
特点:实时的,分布式,具备高容错的计算系统
- storm进程常驻内存
- 数据不经过磁盘,在内存中进行处理
topology = spout(数据分发组件) + bolt(处理组件)
storm架构
架构:
- Nimbus(主节点,功能:资源分配,任务调度,jar任务的上传)
- Supervisor(从节点,功能:管理开启worker进程)
- Worker(从节点开辟的进程,功能:数据处理)
编程模型:
- spout
- bolt
数据传输:
- netty
高可靠性:
- 异常处理
- 消息可靠性保障机制(ACK)
可维护性:
- stormUI图形化监控接口
storm 流式处理
框架对比
- MapReduce:
- Sparking:
storm 计算模型
代码实现
分组策略
8种:
storm架构设计
Nimbus
- 资源调度
- 任务分配
- 接收jar包
Supervisor - 接收nimbus分配的任务·
- 启动、停止自己管理的worker进程
Worker - 启动executor,执行worker任务类型(即spout任务、bolt任务)