Spark独到见解--Action算子总结

Action行动算子

 1、count

      返回数据集中的元素数。会在结果计算完成后回收到Driver端

 2、take(n)

     返回一个包含数据集前n个元素的集合。

 3、first

       first=take(1),返回数据集中的第一个元素。

 4、foreach

      循环遍历数据集中的每个元素,运行相应的逻辑。

5、 collect

      将计算结果回收到Driver端。

 6、foreachPartition

       遍历的数据是每个partition的数据。

 7、countByKey

      作用到K,V格式的RDD上,根据Key计数相同Key的数据集元素。

 8、countByValue

       根据数据集每个元素相同的内容来计数。返回相同内容的元素对应的条数。

 9、reduce

       根据聚合逻辑聚合数据集中的每个元素。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值