spark transformation和action操作

spark中的transformation是lazy特性的,比如我们的wordCount操作,在促发action(foreach)操作前,我们前边的算子是不会实际操作执行的,整个这一块,都是在Driver节点上执行,也就是执行我们自己编写的spark应用程序,但是呢,在action执行之前,所有的transformation都是lazy的,不会立即执行,只有执行的action后,才会促发job,提交task到spark集群上,进行实际的操作

 

当执行action操作的时候,Driver会提交大量的task到之前注册过来的Worker上的executor上去执行

 

第一次算子操作后,其实这个算子的rdd会被废弃掉,数据也会被新的数据所填充

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值