第1课:通过案例对SparkStreaming 透彻理解三板斧之一

第1课:通过案例对SparkStreaming 透彻理解三板斧之一
 
在流处理时代,SparkStreaming有着强大吸引力,而且发展前景广阔,加之Spark的生态系统,Streaming可以方便调用其他的诸如SQL,MLlib等强大框架,它必将一统天下。这里选择Spark Streaming作为版本定制的切入点也是大势所趋。

 将Batch interval放大,相当于看到了Streaming的慢放版本,可以更清楚它的各个环节,这里以黑名单过滤程序为例,进行试验

整个OnlineBlackListFilter应用也就2分钟,而数据接收器receiver 运行了1.5分钟 ,receiver一直不断在接收数据,启动receiver是一个job。receiver在一个work上
运行,receiver跟普通的job没有什么区别,为后续的job做准备。复杂程序有多个 job,receiver是写复杂程序的黄金切入点。

receiver的PROCESS_Local是内存节点,直接使用内存中的数据。receiver是1个executor,处理数据是4个executor

spark-submit其实只有一个作业,但是web ui显示里面有很多job的

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

段智华

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值