spark rdd foreach和foreachPartition

最新推荐文章于 2022-04-24 18:14:17 发布

丹青慕怀

最新推荐文章于 2022-04-24 18:14:17 发布

阅读量703

点赞数

分类专栏： Spark-RDD 文章标签： Spark-RDD-foreach和foreachParti

本文链接：https://blog.csdn.net/qq_38368160/article/details/80016872

版权

Spark-RDD 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

foreach(f)

将方法用于RDD的所以元素

>>> def f( x): print(x)

>>> sc.parallelize([1, 2, 3, 4, 5]).foreach(f)

foreachPartition(f)[source]
将方法用于RDD的每个分区

>>> def f(iterator):
... for x in iterator:
... print(x)
>>> sc.parallelize([1, 2, 3, 4, 5]).foreachPartition(f)

解析：从上面的案例，画横线的部分可以看出，foreach(f)是将iterator的每个数据放入方法中，处理的是每个元素,而foreachPartition(f)是将分区中的iterator直接放入到方法中，然后在方法中自己处理,

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

丹青慕怀

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark rdd foreach和foreachPartition

foreach(f)将方法用于RDD的所以元素&gt;&gt;&gt; def f(x): print(x)&gt;&gt;&gt; sc.parallelize([1, 2, 3, 4, 5]).foreach(f)foreachPartition(f)[source]将方法用于RDD的每个分区&gt;&gt;&gt; def f(iterator):... for x in itera...
复制链接

扫一扫