storm源码分析研究（一）

最新推荐文章于 2023-02-18 20:39:38 发布

王储公子

最新推荐文章于 2023-02-18 20:39:38 发布

阅读量345

点赞数

分类专栏： storm 文章标签： storm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45849855/article/details/120565754

版权

storm 专栏收录该内容

13 篇文章 1 订阅

订阅专栏

2021SC@SDUSC

storm研究综述

2021SC@SDUSC
一、storm综述

storm是Twitter开源的分布式实时大数据处理框架，对于实时计算的意义类似于Hadoop对于批处理的意义，也提供了一些简单高效的原语，让开发更加便利和高效。

二、重点确定及分工

我们小组对于storm的研究，主要集中于重点源码的分析。

首先确定该项项目的重点，经过查阅相关资料初步了解以及更好的分工，初步确定的关键词有Nimbus、Bolt、Zookeeper、Topology、Excutor、Supervisor、Woker、Task、Spout、Tuple和Stream groupings。

我个人的主要任务为了解分析有关于Bolt和Spout的相关代码。

而其中，Stream groupings为小组共同需要合作完成的任务。

三、个人任务初步了解

Storm是一个实时计算框架，它具有主节点 nimbus 和从节点 supervisor。

用户提交作业给nimbus， nimbus把任务分配给supervisor，这些提交的任务就是topology。

运行的作业分为两种 spout 和 bolt。

Storm是流式的处理即处理stream，而stream的内容是tuple（元组）

Spout（获取消息源的组件）生产tuple（元组）发送给bolt（消息处理者）处理，bolt处理过的tuple也可以再次发送给其他的bolt处理，最后存入容器。

具体介绍：
Spout 数据源
消息源Spout是Storm的Topology中的消息生产者（即Tuple的创造者）。Spout 是 Storm 的核心组件之一，它从外部获取数据后，向Topology中发出的Tuple可以是可靠的，也可以是不可靠的。此外，Spout 也可以发射多个流。
Bolt是接收Spout发出元组Tuple后处理数据的组件，所有的消息处理逻辑被封装在Bolt中，Bolt负责处理输入的数据流并产生输出的新数据流。在消息处理者Bolt在Storm中是一个被动的角色。Bolt把元组作为输入，然后产生新的元组作为输出。此外，Bolt也可以发出超过一个的流。

其架构如下图：
参考链接：https://blog.csdn.net/qq_38061534/article/details/86584120

四、安装下载问题

初步将storm源码导入eclipse，首先需要从GitHub上下载源码，然后安装counterclockwise以支持Clojure，以及能够安装Leiningen用来管理Clojure Project。

五、其他问题

后续会根据实际完成情况进行更改

参考链接如下：
https://www.cnblogs.com/zlslch/p/5989707.html

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
storm源码分析研究（一）

2021SC@SDUSCstorm研究综述2021SC@SDUSC一、storm综述storm是Twitter开源的分布式实时大数据处理框架，对于实时计算的意义类似于Hadoop对于批处理的意义，也提供了一些简单高效的原语，让开发更加便利和高效。二、重点确定及分工我们小组对于storm的研究，主要集中于重点源码的分析。首先确定该项项目的重点，经过查阅相关资料初步了解以及更好的分工，初步确定的关键词有Nimbus、Bolt、Zookeeper、Topology、Excutor、Superviso
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。