spark算子基础

最新推荐文章于 2024-07-21 21:43:54 发布

jmzcc

最新推荐文章于 2024-07-21 21:43:54 发布

阅读量139

点赞数

文章标签： spark 大数据分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jmz98/article/details/133705409

版权

创建数组
scala> val a = sc.parallelize(Array(("zhangsan", 99, 98, 100),("lisi", 99, 98, 100),("wangwu", 99, 98, 100)))
a: org.apache.spark.rdd.RDD[(String, Int, Int, Int)] = ParallelCollectionRDD[28] at parallelize at <console>:24

要求：筛选出名字为zhang开头的总分最高分
一、
scala> a.filter(x=>x._1.startsWith("zhang")).map(x=>(x._1,x._2+x._3+x._4)).sortBy(x=> - x._2).take(1)
res30: Array[(String, Int)] = Array((zhangsan,297))

二、
scala> a.filter(x=>x._1.startsWith("zhang")).map(x=>(x._1,x._2+x._3+x._4)).reduceByKey((x,y) => if (x>y) x else y)
res28: org.apache.spark.rdd.RDD[(String, Int)] = ShuffledRDD[51] at reduceByKey at <console>:26

三、
scala> a.filter(x=>x._1.startsWith("zhang")).map(x=>(x._2+x._3+x._4,x._1)).max
res31: (Int, String) = (297,zhangsan)

四、
scala> a.filter(x=>x._1.startsWith("zhang")).map(x=>("zhang",(x._1,x._2+x._3+x._4))).reduceByKey((x,y) => if (x._2>y._2) x else y).collect
res34: Array[(String, (String, Int))] = Array((zhang,(zhangsan,297)))
scala> a.filter(x=>x._1.startsWith("zhang")).map(x=>("zhang",(x._1,x._2+x._3+x._4))).reduceByKey((x,y) => if (x._2>y._2) x else y).map(x=>x._2).collect
res35: Array[(String, Int)] = Array((zhangsan,297))

五、
scala> a.filter(x => x._1.startsWith("zhang")).map(x => (x._1, x._2 + x._3 + x._4)).
| groupBy(x => x._1.substring(0, 5)).map(x => {
| var name = ""
| var sumscore = 0
| val itor = x._2.iterator
| for (e <- itor) {
| if (e._2 > sumscore) {
| name = e._1;
| sumscore = e._2
| }
| }
| (name, sumscore)
| }).collect()
res3: Array[(String, Int)] = Array((zhangsan,297))

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark算子基础

要求：筛选出名字为zhang开头的总分最高分。
复制链接

扫一扫

jmzcc CSDN认证博客专家 CSDN认证企业博客

码龄4年

76: 原创

119万+: 周排名

6万+: 总排名

2万+: 访问

: 等级

795: 积分

24: 粉丝

32: 获赞

5: 评论

29: 收藏

私信

关注

热门文章

最新评论

oracle 基础1
心甘晴源: 厉害加油
HTML5列表
CSDN-Ada助手: 恭喜您写了这篇关于HTML5列表的博客！持续创作是非常重要的，我非常期待您下一步的创作。接下来，我建议您可以写一些关于HTML5表单的内容，这是Web开发中非常重要的一部分。再次感谢您为我们带来有价值的内容。 CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
HTML5的表格
CSDN-Ada助手: 恭喜您写出了这么有价值的博客！对于HTML5表格的介绍十分详细，让我受益匪浅。希望您能继续分享更多关于Web开发的知识，我期待着您的下一篇博客。如果可以的话，我希望您能介绍一下HTML5的音频和视频标签，这也是很多Web开发者感兴趣的话题。再次感谢您的分享！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
HTML5的常用标签
CSDN-Ada助手: 非常感谢您分享这篇关于HTML5的常用标签的博客，对于我们初学者来说，这些基础的标签非常重要。希望您能持续创作，分享更多关于前端开发的知识和经验。除了您提到的常用标签，还有一些我们可以了解和学习的扩展知识和技能，如HTML5的新特性（如语义化标签、视频和音频标签等）、CSS样式和布局、JavaScript交互效果等。希望您在未来的博客中能够分享更多这方面的内容。再次感谢您的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
HTML5入门
CSDN-Ada助手: 恭喜您开始写博客了，HTML5是一个非常有趣和有挑战的主题，希望您能够享受这个学习过程，同时也能够分享您的知识和经验。加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。