storm--流式分布式系统介绍

最新推荐文章于 2022-08-16 08:40:53 发布

bupt_小新

最新推荐文章于 2022-08-16 08:40:53 发布

阅读量2.1k

点赞数

分类专栏： storm big data distributed system 文章标签： big data storm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yumik0/article/details/23380375

版权

折腾storm有一段时间了，上篇博客写了怎么部署自己的storm系统，有必要解释一下的架构和原理。

结合我看到的一些资料，做个简单的总结，尤其是对于storm能做什么，适合做什么，应该是能给刚接触storm的同学们一些启发。

1 诞生

在2011年Storm开源之前，由于Hadoop的火红，整个业界都在喋喋不休地谈论大数据。Hadoop的高吞吐，海量数据处理的能力使得人们可以方便地处理海量数据。但是，Hadoop的缺点也和它的优点同样鲜明——延迟大，响应缓慢，运维复杂。

有需求也就有创造，在Hadoop基本奠定了大数据霸主地位的时候，很多的开源项目都是以弥补Hadoop的实时性为目标而被创造出来。而在这个节骨眼上Storm横空出世了。

Storm带着流式计算的标签华丽丽滴出场了，看看它的一些卖点：

§ 分布式系统：可横向拓展,现在的项目不带个分布式特性都不好意思开源。

§ 运维简单：Storm的部署的确简单。虽然没有Mongodb的解压即用那么简单，但是它也就是多安装两个依赖库而已。

§ 高度容错：模块都是无状态的，随时宕机重启。

§ 无数据丢失：Storm创新性提出的ack消息追踪框架和复杂的事务性处理,能够满足很多级别的数据处理需求。不过，越高的数据处理需求，性能下降越严重。

2 Storm 与传统的大数据

Storm 与其他大数据解决方案的不同之处在于它的处理方式。Hadoop 在本质上是一个批处理系统。数据被引入 Hadoop 文件系统 (HDFS) 并分发到各个节点进行处理。当处理完成时，结果数据返回到 HDFS 供始发者使用。Storm 支持创建拓扑结构来转换没有终点的数据流。不同于 Hadoop 作业，这些转换从不停止，它们会持续处理到达的数据

3 Storm的基本架构

Storm 是一个免费开源、分布式、高容错的实时计算系统。Storm令持续不断的流计算变得容易，弥补了Hadoop批处理所不能满足的实时要求。Storm经常用于在实时分析、在线机器学习、持续计算、分布式远程调用和ETL等领域。Storm的部署管理非常简单，而且，在同类的流式计算工具，Storm的性能也是非常出众的。

Storm主要分为两种组件Nimbus和Supervisor。这两种组件都是快速失败的，没有状态。任务状态和心跳信息等都保存在Zookeeper上的，提交的代码资源都在本地机器的硬盘上。

§ Nimbus负责在集群里面发送代码，分配工作给机器，并且监控状态。全局只有一个。

§ Supervisor会监听分配给它那台机器的工作，根据需要启动/关闭工作进程Worker。每一个要运行Storm的机器上都要部署一个，并且，按照机器的配置设定上面分配的槽位数。

§ Zookeeper是

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
storm--流式分布式系统介绍

折腾storm有一段时间了，上篇
复制链接

扫一扫

专栏目录

博客等级

码龄13年

5
原创

0
点赞

0
收藏

7
粉丝

关注

私信

热门文章

分类专栏

算法 1篇
linux 1篇
JAVA 1篇
JDK 1篇
机器学习 2篇
maching learning 1篇
统计学习方法 2篇
storm 2篇
zookeeper 1篇
zeromq 1篇
jzmq 1篇
storm-starter 1篇
支持向量机 1篇
big data 1篇
distributed system 1篇

最新评论

流式分布式系统Storm安装与部署
peixuan197: 我按照您的步骤出现了问题： 1,nimbus 启动不起来，日志文件显示starting Nimbus server。。。就不动了。 2.web ui 打不开还望指教！！谢谢
SVM-支持向量机简介
12ycli: 开始看到前面很高兴，可是看到后面什么都没有，只有简介。楼主可以加下QQ吗？
storm--流式分布式系统介绍
清明采薇: so good.You cleared my mind~thankyou
菜鸟眼中的machine learning和我的一些机器学习方法
ZiQingFeng: lz是在做机器学习方面的项目吗
流式分布式系统Storm安装与部署
xue09210103: 感谢大神！！！要部署storm，但是网上的安装文档太少了，好顶赞~

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。