spark[4]:工作流程

一、workflow sequence

比如如下的一段代码在spark中的具体执行过程:
在这里插入图片描述
这段代码将会在生成两个具体的jobs:

  1. read the parquet file
  2. performs the action to collection the computations to send to the driver.

job2 有两个stages, 因为存在shuffle(grouping data by country)
在这里插入图片描述

首先,应用(application)创建Job, 在stage中将任务分解为task,每个task的宽度表明这个task的执行时间。

在进入下一个stage,必须等所有的task对应partition都执行完成之后方可开始。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值