Storm常见模式1——BasicBolt

1.Storm中与各个进程与hadoop进程对应关系是怎么样的?
2.Storm中与hadoop对应的mapreduce是什么?



Storm中的很多Bolt都有一个最常见的处理步骤:

读入一个tuple;
根据这个输入tuple,提取后发射0个,1个或多个tuple;
最后,通过ack操作确认这个tuple被成功处理。
按照上述处理步骤,依次处理发向这个Bolt的各个tuple元组。

这种模式可以实现像ETL这类的简单函数或过滤器功能,Storm中专门为这种模式封装了相应接口:IBasicBolt。BaseBasicBolt等类实现了这一接口。

为了能更好的理解Storm,及出现的术语,这里提供一张图:
 


下面是以BaseBasicBolt为基础,按照上述模式实现词频统计的Bolt(代码参考链接:storm-starter):
  1. public static class WordCount extends BaseBasicBolt {
  2.      //记录每个单词及单词出现的次数
  3.         Map<String, Integer> counts = new HashMap<String, Integer>();

  4.         @Override
  5.         public void execute(Tuple tuple, BasicOutputCollector collector) {
  6.             String word = tuple.getString(0);
  7.             Integer count = counts.get(word); //提取单词出现次数
  8.             if(count==null)
  9.          count = 0;
  10.             count++;
  11.             counts.put(word, count); //更新单词出现次数
  12.             collector.emit(new Values(word, count)); //发射统计结果
  13.         }

  14.         @Override
  15.         public void declareOutputFields(OutputFieldsDeclarer declarer) {
  16.        declarer.declare(new Fields("word", "count"));
  17.         }
  18.     }

转载: http://www.aboutyun.com/thread-7375-1-4.html


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值