Spark之Action算子（一）

最新推荐文章于 2024-08-19 18:02:04 发布

土豆钊

最新推荐文章于 2024-08-19 18:02:04 发布

阅读量1.4w

点赞数 2

分类专栏： Spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013384984/article/details/79443545

版权

Spark 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

Spark算子分为两大类，本文介绍Action类算子。

（1）reduce算子

按照官网的解释，传入的参数是一个函数，一个双参数，返回值唯一的函数，建议，该函数是可交换的，是可联合的，如此，才能实现正确的并行计算。

这里的函数，我平时用过加法操作，最大值操作，最小值操作；记得大数据里提过这个概念，诸如此类可以合并操作的函数，是最合适的，平均值类的，就不适用于此种操作了。

如上图，使用并行化产生了一个算子，然后reduce内传入偏函数，最终生成结果如下：

此处操作，就类似于求和操作了；如果对于String类型的，则会实现拼接操作。

（2）Collect算子

将数据集的所有元素，按照数组的形式予以返回，该算子通常用于对于数据集过滤或者进行其他操作后返回的足够小的集合；我是通常用在Scala命令行交互中，能够得到结果输出。

（3）count算子

这个简单，顾名思义，返回数据集中元素的总数。

（4）first

返回数据集中的第一个元素，类似于take（1），注意，此处并未说明是否是有序的数据集；而且只能返回一个元素。

（5）take

这里，可以传入参数，返回的也是一个数组，就算是n=1，返回的也是一个仅有一个元素的数组，同样，对数据集的数据类型和是否有序没有任何规定

（6）taksSample

类似于sample算子，参数意义都相同，只是该操作会直接执行，返回从数据集中取出的随机样本

（7）takeOrdered

该方式，类似于take算子，但是返回的元素按照自然序排序，或者自定义的比较器进行排序。

该算子，重在于返回的是有序集合。

（8）saveAsTextFile

将数据集的所有元素，作为文本文件，或者一系列问问本间，写入本地文件系统，HDFS或者其他Hadoop支持的文件系统，对于其中的每个元素，Spark会调用toString方法，将其转换为文件中的一行文本。

常用于生成结果的存储。

（9）foreach

foreach算子，参数为传入的函数，对于数据集中的每个元素，都实现该函数，有点类似于map，但是能够返回结果。

（10）countByKey

只对于map类型的rdd有作用，说明很详细，下附代码：

作为无参函数，只会记录数量；与reduceByKey看起来相似，实则差距很大；上述代码返回结果：

（11）savaAsObjectFile

也是文件保存的方式，但是会用Java序列化的方式，按照简单的格式把数据集内的每个元素写入文件，而对于这类文件，使用objectFile方式进行加载，

（12）saveAsSequenceFile

同样是保存文件的一种形式，但其只能针对key-value格式的数据起作用；在Scala中，也可以针对可以隐式转换成Writable类型的数据起作用；在我开发代码的过程中，很少用这个，在此不详细介绍了。

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

土豆钊 CSDN认证博客专家 CSDN认证企业博客

码龄11年

63: 原创

9万+: 周排名

73万+: 总排名

39万+: 访问

: 等级

2963: 积分

274: 粉丝

635: 获赞

116: 评论

1570: 收藏

私信

关注

热门文章

分类专栏

最新评论

匈牙利算法-看这篇绝对就够了！
我和彭于晏压力山大: 后面抢媳妇儿的例子我倒是明白了，这个交错路径，增广路径始终看不懂
匈牙利算法-看这篇绝对就够了！
命克桃花的单身小天才: 我的想法是这样的：在前面x1,x2一一去找它们的第一个头，构成边(x1,y1), (x2,y2)，也构成匹配M；后面加入x3，去找第一头y1，因为匈牙利算法，x1需要“让位”, 去找第二个头y2；然后x2也“让位”，去找第二个头y5。现在是(x3,y1), (x1, y2), (x2,y5)，这三条边因为匈牙利算法"让位"的缘故，和匹配M中的两条边交错连接，构成增广路径P（我觉得"让位"这里很妙，让原来没有“争端”的点边们构成匹配M，然后有点“争抢”它们另一头时，M家族就纳入她们，后面“让位”后形成的更大匹配M'和原来的M匹配就是交错的，就形成了增广匹配P）以上是我的个人思考
匈牙利算法-看这篇绝对就够了！
TBE小屋: 为什么x3一定要y1，不能x3和y3吗，这是有啥条件吗，就这里没看明白
匈牙利算法-看这篇绝对就够了！
LeoBoML: 是匹配边上的
匈牙利算法-看这篇绝对就够了！
LeoBoML: 我也疑惑，增广路的端点不是非匹配点吗?

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。