Spark streaming 与 Flume 结合消息处理机制 Push 与 Poll 对比分析

1.  Push 方式(flume 主动)

Flume 将消息推送到 SparkStreaming 中 worker 的 executor 处理,但是其缺点是 flume 只能指定一个executor 来处理,这样会给单个节点中executor造成很大的压力,故不推荐该方式。

部分实例代码

//推送方式: flume向spark(spark 地址一个,具体来说启动的是spark集群中某个work的地址)发送数据
val flumeStream = FlumeUtils.createStream(ssc, "192.168.2.2", 8888)

注意:192.168.2.2 是spark集群中某个worker地址,这个造成该方式的缺点。

 

2.  Poll  方式(sparkStreaming 主动)

Spark Streaming 会从Flume中 拉取数据,可以指定多个flume地址。但是其处理该数据的worker可以指定多个,可以设置为默认值,故不会出现单个executor处理数据压力很大的情况。

部分实例代码

//从flume中拉取数据(flume的地址,可以多个)
val address = Seq(new InetSocketAddress("192.168.2.181", 8888))
val flumeStream = FlumeUtils.createPollingStream(ssc, address, StorageLevel.MEMORY_AND_DISK)
val words = flumeStream.flatMap(x => new String(x.event.getBody().array()).split(" ")).map((_,1))
val results = words.updateStateByKey(updateFunc, new HashPartitioner(ssc.sparkContext.defaultParallelism), true)

3、总结

推荐使用 poll方式!

 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值