Storm是什么?

最新推荐文章于 2021-11-28 21:28:23 发布

houbin0912

最新推荐文章于 2021-11-28 21:28:23 发布

阅读量1.3k

点赞数

分类专栏：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/houbin0912/article/details/72967206

版权

大数据专栏收录该内容

17 篇文章 0 订阅

订阅专栏

1.定义:

storm是一个分布式实时计算系统,用户只需要提供自己的插件(例如一个jar包，其中编写用户自己的逻辑代码)，然后将它部署到storm服务器上，storm的master服务器就会为我们自动将jar包分配到slave服务器的进程中，然后在slave服务器中运行。(注意:master服务器只会接受用户提供的插件(也称之为拓扑，如果是java语言编写的插件可以说一个jar包就是一个拓扑),然后分配代码到slave服务器，在slave服务器上真正运行我们的代码)。

2.特点:低延迟、分布式、高性能、高容错(Ack机制)、可扩展、消息保证有序性。

3.系统角色:

(1)Nimbus:存在于master服务器,主要帮助分配拓扑到slave服务器中。

(2)Supervisor:负责接受nimbus分配的任务，启动和停止属于自己管理的worker进程。

(3)Worker:运行拓扑的进程。

4.系统组件:

(1)spout:发送数据源的一个组件(在我们提供的拓扑中，实现此接口后在对应方法中获取要处理的数据，比如一个log文件内容，然后发送到所关联bolt进行具体数据内容的处理)。

(2)bolt:接受由spout发送过来的数据进行处理。(bolt主要做数据处理，我们的具体的业务逻辑都写在在此接口的实现类中)。

补充:Task：worker中每一个 Spout /bolt的线程称为一个task. 在 Storm 0.8之后，task不再与物理线程对应，同一个 Spout /bolt的task可能会共享一个物理线程，该线程称为executor。

5.系统原理图:

总结:storm其实就是一个数据实时处理中心，比如我们想要监控系统的日志情况，出现异常后可以记录到数据库，就可以根据storm的规范提供一个组件(也就是拓扑)，然后发布到storm集群中就可以了，storm保证了消息的安全性(出现异常不会丢失)，有序性，身为程序猿的我们只需要根据系统需求配置好storm服务器的参数（参数后续会将），然后发布我们提供的拓扑就已达到我们的目的。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。