storm开发篇1 - 示例入门

最新推荐文章于 2024-08-07 09:51:55 发布

九灯

最新推荐文章于 2024-08-07 09:51:55 发布

阅读量2.5k

点赞数 1

分类专栏： storm 文章标签： storm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/seanme/article/details/79766599

版权

这篇博客介绍了Storm的基本概念，如Stream、Spout、Bolt和Tuple，详细讲解了它们在数据处理中的角色。此外，还阐述了Task、Worker和Stream Grouping的工作原理。通过一个单词计数的示例，展示了Storm拓扑结构的创建和运行流程。

摘要由CSDN通过智能技术生成

storm java 开发的hello world 入门示例

Storm中的核心概念:

Stream: 流是一个没有边界的Tuple序列，这些Tuple以分布式的方式并行创建与处理

Spout:是Topology中消息的生产者（即是Tuple的创建者）

Bolt:消息的处理者

是接收Spout发出Tuple后处理数据的组件，并产生新的数据输出流。可执行过滤，合并，统计等操作。

生命周期：客户端创建Bolt，然后将其序列化拓扑，并提交给集群中的主机。集群启动worker进程，反序列化Bolt，调用prepare方法开始处理Tuple

Tuple:可简单的认为是消息传递时约定的一种数据结构,Fields-Values形式。可形象的比喻为数据库表定义与数据储存，定义好了Fields之后它的值可能就是一个Values的列表.Fields默认支持的类型有:Integer,float,double,long,short,string,byte 其它类型的就需要序列化了

大概看一下Fields对应的源码

Tuple的生命周期：backtype.storm.spout.ISpout 实现接口负责产生与传递Tuple

Task:每一个Spout/Bolt的运行线程称为一个Task,也就是Spout/Bolt的执行单元

Worker:是一个java进程，执行Topology的一部分任务。会启动一个或是多个executor线程来执行一个Topology的组件(Spout/Bolt)，因此在执行时，可能跨一个或是多个worker

Stream Grouping:定义一个流如何分配Tuple到Bolt的，主要流分组类型有：

随机分组
字段分组
全部分组：对于每一个Tuple来说，所有的Bolt都会收到
全局分组:全部的流都分配到Bolt的同一个任务
无分组
直接分组：元组的生产者决定元组由哪个元组消费者任务接收

Topology:

在分布式模式时，需要打包成JAR包放到Nimbus中运行。在打包时不需要把依赖的Jar都打进去。

在nimbus服务器上提交&#

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
storm开发篇1 - 示例入门

storm java 开发的hello world 入门示例Storm中的核心概念:Stream: 流是一个没有边界的Tuple序列，这些Tuple以分布式的方式并行创建与处理Spout:是Topology中消息的生产者（即是Tuple的创建者） Bolt:消息的处理者是接收Spout发出Tuple后处理数据的组件，并产生新的数据输出流。可执行过滤，合并，统计...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。