Spark RDD(二) RDD的相关行为(Action)操作

Spark RDD(二) RDD的相关行为(Action)操作

Action操作会真正触发转换逻辑(转换操作参见上一篇Spark RDD(一))。本文主要介绍常见的Action操作。

常见Action操作有以下9种:

  • collect()
  • count()
  • first()
  • take(n)
  • reduce(func)
  • takeSample(withReplacement, n, [seed])
  • takeOrdered(n, [ordering])
  • top(n, [ordering])
  • saveAsTextFile(path)
  1. collect() 操作

collect() 会从RDD的每一个partition中手机所有行数据并发送给driver程序。要注意不要对太多数据执行此操作,否则driver程序会报OOM。

例子:

val numberRDD =  spark.sparkContext.parallelize(List(1,2,3,4,5,6,7,8,9,10), 2)
numberRDD.collect()

输出为:

Array[Int] = Array(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
  1. count()操作

count() 操作通过获取每一个partition中的行数并求和来获得一个RDD的行数。

例子:

val numberRDD =  spark.sparkContext.par
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值