spark源码action系列-take

本文详细解析了Spark中的RDD行动操作take的工作原理。take主要用于获取RDD的前n个元素,它首先尝试从第一个分区开始,如果不足则遍历后续分区,直到找到n个元素或遍历所有分区。在执行过程中,根据已获取数据和目标数量动态调整读取的分区数。此外,当take的数量为0时,直接返回空数组,而不启动Job。
摘要由CSDN通过智能技术生成

RDD.take的操作

在这个action的操作中:

Take的操作主要用于取出前n条数据的操作,这个操作中首先从第一个partition中去找,如果第一个partition中无法取出前n条数据时,再接下来从后面的partition中接着去找.直到取到n条数据或者说partition中都已经找完.与其对应的还有takeOrder的操作,这个后面在说.

发起JOB的过程:

1,如果take的操作是0,那么直接返回,job都不启动.这里面好像没有对值是负数的判断.

if (num == 0) {
  new 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值