Spark核心RDD：foldByKey函数详解

最新推荐文章于 2021-10-29 22:13:39 发布

zghgchao

最新推荐文章于 2021-10-29 22:13:39 发布

阅读量3.8k

点赞数

分类专栏： spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_22027637/article/details/78825299

版权

spark 专栏收录该内容

31 篇文章 0 订阅

订阅专栏

foldByKey(zeroValue: V, numPartitions: Int)(func: (V, V) => V): RDD[(K, V)]
foldByKey(zeroValue: V)(func: (V, V) => V): RDD[(K, V)]
foldByKey(zeroValue: V, partitioner: Partitioner)(func: (V, V) => V): RDD[(K, V)]

foldByKey操作作用于RDD[K,V]根据K将V做折叠、合并处理，其中的参数zeroValue表示先根据映射函数将zeroValue应用与V，进行初始化V，在将映射函数应用于初始化后的V。

scala> val rdd1 = sc.makeRDD(Array(
     |       ("A", 1), ("A", 2), ("B", 1), ("B", 2), ("C", 1)
     |     ))
rdd1: org.apache.spark.rdd.RDD[(String, Int)] = ParallelCollectionRDD[12] at makeRDD at <console>:24

scala> /**
     |       * rdd1中每个key对应的V进行累加，注意zeroValue=0，需要先初始化V，映射函数为+操作
     |       * 比如，("A", 1), ("A", 2)，先将zeroValue应用于每个V，得到("A", 1+0), ("A", 2+)，
     |       * 即，("A", 1), ("A", 2)，在将映射函数应用于初始化后的V，最后得到("A", 1+@), ("A", 3)
     |       */
     |     rdd1.foldByKey(0)(_+_).collect()
res14: Array[(String, Int)] = Array((B,3), (A,3), (C,1))

//映射函数为乘法时，zeroValue需设置成1
    rdd1.foldByKey(1)(_*_).collect

res16: Array[(String, Int)] = Array((B,2), (A,2), (C,1))

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
3
评论
Spark核心RDD：foldByKey函数详解

foldByKey(zeroValue: V, numPartitions: Int)(func: (V, V) => V): RDD[(K, V)]foldByKey(zeroValue: V)(func: (V, V) => V): RDD[(K, V)]foldByKey(zeroValue: V, partitioner: Partitioner)(func: (V, V) =>
复制链接

扫一扫

专栏目录

zghgchao CSDN认证博客专家 CSDN认证企业博客

码龄10年

89: 原创

10万+: 周排名

99万+: 总排名

21万+: 访问

: 等级

2921: 积分

24: 粉丝

39: 获赞

18: 评论

104: 收藏

私信

关注

热门文章

分类专栏

java 数据结构与算法学习 1篇
hadoop 15篇
spark 31篇
java 45篇
mapReducer 1篇
Linux 10篇
kafka 1篇
Hbase 3篇
Hive 5篇
spark，DataFrame 1篇
DataFrame 2篇
DataSet 1篇
数据可视化 1篇
yarn 1篇
json 1篇
sparkStreaming
springData 2篇
jpaTemplate
MySQL 1篇
html 2篇
s
springCloud 3篇
springBoot 8篇
SQL 2篇
git 2篇

最新评论

Spring MVC请求包含List参数
CSDN-Ada助手: 非常感谢您的分享，这篇博客对于理解Spring MVC请求包含List参数非常有帮助。我建议你可以继续写关于Spring MVC的文章，比如如何处理文件上传和下载。这样的技术文章对其他用户也十分有用，相信会有更多读者受益。期待您的下一篇精彩博文！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
iview select 弹窗向上时被遮挡住了解决办法
我是朋朋啊: 设置transfer后下拉框高度变得特别高怎么解决
SpringBoot RestTemplate进行POST请求，from-data传参
超级猿力: 牛逼直接就给我把困难解决了
RDD保存SaveMode
吓人一跳: 这个不是rdd的吧，是sparksql结果集的df的保存方式吧
java List转String去掉[ 、]、空格
Tisfy: Nice!,古人云：酒债寻常行处有，人生七十古来稀。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。