storm的一些基本概念

要了解storm,首先需要了解以下几个概念

1. 拓扑Topologies

  一个实时应用程序的逻辑被打包成一个Storm的拓扑。一个拓扑类似于Hadoop中的MapReduce作业。但是MapReduce作业最终会运行完成,而一个拓扑作业将一直运行。除非显示的将它杀死。一个拓扑是一张图,这张图由管口spouts和门闩bolts,以及连接他们的流stream所组成。


2. 流steams

  流是Storm中的核心抽象。一条流是一个没有限制长度的元组序列。这个序列被以一种分布式的方式处理和创建。定义流时需要定义一个schema来确定元组的每个字段。一个元组可以包含integer, long, short, byte, string, double, float, boolean, and byte array。用户也可以通过定义指定的序列器创建自定义类型。


3. 管口spouts

  管口是拓扑中的流之源。它从外部读取元组并传入拓扑中。它既可以是可靠的也可以是不可靠的。可靠意味者当传入的数据处理失败的话,它能重新传入。不可靠则不关心是否被成功处理。


4. 门闩bolts

  具体的数据处理都是在门栓上完成的:过滤,函数,聚合,连接,写入数据库等。


5. 分流stream groupings

  定义如何分发流中的元组到多个门闩任务上。内建了7种方法,用户可以实现自定义方法。

  

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值