storm的tail特性和stream grouping

spout的tail特性也就是监听特性,也就是说如果有新增的数据,会把新增的数据读进来

tail适合文本源

如果是mq(消息队列)源的话,该特性没必要

如果是消息队列,spout只需要执行消息队列的consumer的代码就可以了,相当于就是一个consumer的角色


关于storm-starter就是初学者可以学习的很多例子包

https://github.com/nathanmarz/storm-starter.git


stream grouping就是用来定义一个stream应该如何分配给bolts上面的多个tasks

storm里面有6种类型的stream grouping:
1.shuffle grouping:随机分组,随机派发stream里面的tuple,保证每个bolt接收到的tuple数目相同(轮询,也是用的最多的)

2.fields grouping:按字段分组,比如按userid来分组,具有相同userid的tuple会被分到相同的bolts,而不同的userid则会被分配到不同的bolts

3.all grouping:广播发送,对于每一个tuple,所有的bolts都会收到

4.global grouping:全局分组,这个tuple被分配到storm中的一个bolt的其中一个task,在具体一点就是分配给id值最低的那个task

5.Non grouping:不分组,这个分组的意思是说stream不关心到底谁会收到它的tuple。目前这种分组和shuffle grouping是一样的效果,有一点不同的是storm会把这个bolt放到这个bolt的订阅者同一个线程里面去执行,这个是不平均的。

6.Direct grouping:直接分组,这是一种比较特别的分组方法,用这种分组意味着消息的发送者决定由消息接收者的哪个task处理这个消息。只有被声明为direct stream的消息流可以声明这种分组方法。而且·这种消息tuple必须使用emitDirect方法来发射。消息处理者可以通过topologycontext来处理它的消息的taskid(outputcollector.emit方法也会返回taskid)


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值