实时分布式具备高容错性的计算系统storm------核心topology架构图和storm运行topology的工作流程图

最新推荐文章于 2022-03-23 21:00:00 发布

buster2014

最新推荐文章于 2022-03-23 21:00:00 发布

阅读量1.8k

点赞数

分类专栏： storm流式计算框架 yun hadoop

hadoop 同时被 3 个专栏收录

59 篇文章 0 订阅

订阅专栏

42 篇文章 0 订阅

订阅专栏

storm流式计算框架

4 篇文章 0 订阅

订阅专栏

文章来源：http://blog.csdn.net/yangbutao/article/details/8445630

hadoop一般用在离线的分析计算中，而storm区别于hadoop，用在实时的流式计算中，被广泛用来进行实时日志处理、实时统计、实时风控等场景，当然也可以用在对数据进行实时初步的加工，存储到分布式数据库中如HBase，便于后续的查询。

面对的大批量的数据的实时计算，storm实现了一个可扩展的、低延迟、可靠性和容错的分布式计算平台。

1、对象介绍

tuple：表示流中一个基本的处理单元，可以包括多个field，每个filed表示一个属性

topology：一个拓扑是一个个计算节点组成的图，每个节点包换处理的逻辑，节点之间的连线表示数据流动的方向

spout：表示一个流的源头，产生tuple

bolt：处理输入流并产生多个输出流，可以做简单的数据转换计算，复杂的流处理一般需要经过多个bolt进行处理

nimnus：主控节点，负责在集群中发布代码，分配工作给机器，并且监听状态

supervisor：一个机器，工作节点，会监听分配给的工作，根据需要启动和关闭工作进程。

woker：执行topology的工作进程，用于生成task

task：每个spout和bolt都可以作为task在storm中运行，一个task对应一个线程

storm拓扑topology的组成见下图，

2、整体架构

客户端提交拓扑到nimbus。

Nimbus针对该拓扑建立本地的目录根据topology的配置计算task，分配task，在zookeeper上建立assignments节点存储task和supervisor机器节点中woker的对应关系；

在zookeeper上创建taskbeats节点来监控task的心跳；启动topology。

Supervisor去zookeeper上获取分配的tasks，启动多个woker进行，每个woker生成task，一个task一个线程；根据topology信息初始化建立task之间的连接;Task和Task之间是通过zeroMQ管理的；后整个拓扑运行起来。

上述只是介绍了storn的整个工作流程，当然storm在可靠性、容错性等方面考虑的比较全面，这后续再补充。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。