【Storm】入门原理介绍

最新推荐文章于 2021-01-19 13:46:25 发布

玄苦大师233

最新推荐文章于 2021-01-19 13:46:25 发布

阅读量256

点赞数

分类专栏： 16. Storm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chenguolinblog/article/details/90637893

版权

本文介绍了Storm实时计算系统的基本原理，包括其在实时处理中的地位、集群组件如Nimbus和Supervisor，以及核心概念：Topology、Stream、数据模型、流分组策略和可靠的消息处理机制。详细讲解了Spout和Bolt的角色以及如何构建和运行Topology。

摘要由CSDN通过智能技术生成

一. Storm简介

Storm是一个分布式的、高容错的实时计算系统。
Storm对于实时计算的的意义相当于Hadoop对于批处理的意义。Hadoop为我们提供了Map和Reduce原语，使我们对数据进行批处理变的非常的简单和优美。同样，Storm也对数据的实时计算提供了简单Spout和Bolt原语。

Storm适用的场景

流数据处理：Storm可以用来用来处理源源不断的消息，并将处理之后的结果保存到持久化介质中。
分布式RPC：由于Storm的处理组件都是分布式的，而且处理延迟都极低，所以可以Storm可以做为一个通用的分布式RPC框架来使用。

二. Storm集群基本组件

Storm的集群表面上看和hadoop的集群非常像。但是在Hadoop上面你运行的是MapReduce的Job, 而在Storm上面你运行的是Topology。它们是非常不一样的，一个关键的区别是：一个MapReduce Job最终会结束，而一个Topology永远运行（除非你显式的杀掉他）。

在Storm的集群里面有两种节点：

控制节点(master node)：控制节点上面运行一个后台程序Nimbus，它的作用类似Hadoop里面的JobTracker。Nimbus负责在集群里面分发代码，分配工作给机器，并且监控状态。
工作节点(worker node)：每一个工作节点上面运行一个叫做Supervisor的进程（类似 TaskTracker）。Supervisor会监听分配给它那台机器的工作，根据需要启动/关闭工作进程。每一个工作进程执行一个Topology（类似 Job）的一个子集

最低0.47元/天解锁文章

玄苦大师233

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【Storm】入门原理介绍

一. Storm简介Storm是一个分布式的、高容错的实时计算系统。Storm对于实时计算的的意义相当于Hadoop对于批处理的意义。Hadoop为我们提供了Map和Reduce原语，使我们对数据进行批处理变的非常的简单和优美。同样，Storm也对数据的实时计算提供了简单Spout和Bolt原语。Storm适用的场景流数据处理：Storm可以用来用来处理源源不断的消息，并将处理之后的结果...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。