storm的tail特性和stream grouping

最新推荐文章于 2022-01-19 10:46:30 发布

森总工作室

最新推荐文章于 2022-01-19 10:46:30 发布

阅读量598

点赞数

分类专栏： DB技术&&数仓技术文章标签： storm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zengxiaosen/article/details/52743871

版权

DB技术&&数仓技术专栏收录该内容

179 篇文章 3 订阅

订阅专栏

spout的tail特性也就是监听特性，也就是说如果有新增的数据，会把新增的数据读进来

tail适合文本源

如果是mq（消息队列）源的话，该特性没必要

如果是消息队列，spout只需要执行消息队列的consumer的代码就可以了，相当于就是一个consumer的角色

关于storm-starter就是初学者可以学习的很多例子包

https://github.com/nathanmarz/storm-starter.git

stream grouping就是用来定义一个stream应该如何分配给bolts上面的多个tasks

storm里面有6种类型的stream grouping：
1.shuffle grouping：随机分组，随机派发stream里面的tuple，保证每个bolt接收到的tuple数目相同（轮询，也是用的最多的）

2.fields grouping：按字段分组，比如按userid来分组，具有相同userid的tuple会被分到相同的bolts，而不同的userid则会被分配到不同的bolts

3.all grouping：广播发送，对于每一个tuple，所有的bolts都会收到

4.global grouping：全局分组，这个tuple被分配到storm中的一个bolt的其中一个task，在具体一点就是分配给id值最低的那个task

5.Non grouping：不分组，这个分组的意思是说stream不关心到底谁会收到它的tuple。目前这种分组和shuffle grouping是一样的效果，有一点不同的是storm会把这个bolt放到这个bolt的订阅者同一个线程里面去执行，这个是不平均的。

6.Direct grouping：直接分组，这是一种比较特别的分组方法，用这种分组意味着消息的发送者决定由消息接收者的哪个task处理这个消息。只有被声明为direct stream的消息流可以声明这种分组方法。而且·这种消息tuple必须使用emitDirect方法来发射。消息处理者可以通过topologycontext来处理它的消息的taskid（outputcollector.emit方法也会返回taskid）

森总工作室

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
storm的tail特性和stream grouping

spout的tail特性也就是监听特性，也就是说如果有新增的数据，会把新增的数据读进来tail适合文本源如果是mq（消息队列）源的话，该特性没必要如果是消息队列，spout只需要执行消息队列的consumer的代码就可以了，相当于就是一个consumer的角色关于storm-starter就是初学者可以学习的很多例子包https://github.com/nathanm
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。