Storm学习笔记(五)——Storm的并发机制

本文详细介绍了Storm的并发机制,包括Node、Worker、Task和Executor的概念。同时,重点解析了Stream Grouping的六种类型,如随机分组、字段分组等,并通过例子展示了它们在实际应用中的作用。此外,文章还讨论了如何通过增加并发度来优化性能,包括增加worker和executor的数量。
摘要由CSDN通过智能技术生成

目录

Storm数据流分组

Stream消息流

Stream Grouping消息流组

Storm并发机制

Storm的并发度

增加Storm的并发度的代码


Storm数据流分组

词频统计的Topology的并发可以如下图所示:

WordCountSpout---->SplitBolt 过程:发送的是一行一行的数据,任何一个SplitBolt都可进行处理。

SplitBolt--->WordCountBolt 过程:发送的是一个一个的单词,同一个单词必须发给同一个WordCountBolt

WordCountBolt--->ReportBolt 过程:发送的是单词和频次,收到后打印输出即可

Stream消息流

Stream是Storm中最关键的抽象,是一个没有边界的Tuple序列,这些Tuple以分布式的方式并行地常见和处理。定义消息流主要是定义消息流中的Tuple。每个消息流在定义时都会分配一个ID,因为单向消息流很普遍,OutputFieldsDeclarer定义了一些方法可以定义一个流而不指定其ID。在这种情况下,该流有一个默认的ID。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值