spark之常见的Action操作

个人感觉不错的文章链接:https://www.cnblogs.com/MOBIN/p/5414490.html

本发所讲函数

1.reduce

2.collect

3.count

4.first

5.take

6.top

7.takeOrdered

8.countByKey

9.collectAsMap

10.lookup

11.aggregate

12.fold

13.saveAsFile

14.saveAsSequenceFile

 

1.reduce(func):通过函数func先聚集各分区的数据集,再聚集分区之间的数据,func接收两个参数,返回一个新值,新值再做为参数继续传递给函数func,直到最后一个元素

 

2.collect():以数据的形式返回数据集中的所有元素给Driver程序,为防止Driver程序内存溢出,一般要控制返回的数据集大小

 

3.count():返回数据集元素个数

 

4.first():返回数据集的第一个元素

 

5.take(n):以数组的形式返回数据集上的前n个元素

 

6.top(n):按默认或者指定的排序规则返回前n个元素,默认按降序输出

 

7.takeOrdered(n,[ordering]): 按自然顺序或者指定的排序规则返回前n个元素

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值