Spark Streaming揭秘 Day1

Spark Streaming揭秘 Day1

三大不解之谜

引子

今天是第一节课,让我们从头开始
根据Quick Example (Batch Interval需设置为30秒)运行一个Spark Streaming程序,然后进行观察。

谜题一:5个Job?

从Demo代码来看,仅调用了print方法,一次action触发应该调用一次Job。
但实际上共运行5个job!!!
这里写图片描述
除了我们实际运行action的Job以外,其他Job的作用是什么呢?

谜题二:神奇的接收器?

Job1是Receiver,主要定位是接收外部数据,但需要注意的是,这个Job仅运行在一台Worker上。
这里写图片描述
但从Job2来看,实际执行是分布式的,而且都是本地内存运行(Process_local)!!!
这里写图片描述

单点运行的接收器如何驱动分布式的本地内存运行?

谜题三:消失的Job?

从控制台输出,可以看到Job4实际执行了任务,
这里写图片描述
但是从执行内容看,Job2、Job3、Job4都执行了Print方法。
这里写图片描述
Job2、Job3在实际执行过程中消失了,他们到底是做什么的?

欲知后事如何,且听下回分解

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值