自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

2301_80087224的博客

原创 Spark中各类方法总结

在进行处理时， reduceByKey (）方法将相同键的前两个值传给输入函数，产生一个新的返回值，新产生的返回值与 RDD 中相同键的下一个值组成两个元素，再传给输入函数，直到最后每个键只有一个对应的值为止。使用 flatMap (）方法时先进行 map （映射）再进行 flat （扁平化）操作，数据会先经过跟 map (）方法一样的操作，为每一条输入返回一个迭代器（可迭代的数据类型），然后将所得到的不同级别的迭代器中的元素全部当成同级别的元素，返回一个元素级别全部相同的 RDD。

2024-05-09 20:02:42 1147 3

原创 Spark概述

结构化数据：即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。非结构化数据：不方便用数据库二维逻辑表来表现的数据，包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。5.MapReduce和Spark的区别（1）Spark的速度比MapReduce快，Spark把运算的中间数据存放在内存，迭代计算效率更高；mapreduce的中间结果需要落地，需要保存到磁盘，比较影响性能；（2）spark容错性高，它通过弹性分布式数据集RDD来实现高效容错；

2024-03-04 17:36:08 896 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

野枝绕青巍 CSDN认证博客专家 CSDN认证企业博客

码龄1年

IP 属地：湖北省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

2: 原创

175万+: 周排名

16万+: 总排名

2043: 访问

: 等级

64: 积分

25: 粉丝

42: 获赞

4: 评论

45: 收藏

私信

关注

热门文章

最新评论

Spark中各类方法总结
普通网友: 优质好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Spark中各类方法总结
普通网友: 写的很好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Spark中各类方法总结
CSDN-Ada助手: 很高兴看到您分享了关于Spark中各类方法的总结，这对于正在学习和使用Spark的同学来说一定是非常有用的参考资料。希望您能继续写下去，分享更多关于Spark的经验和技巧。除了reduceByKey()和flatMap()这两个方法，您还可以尝试了解一下Spark中的其他常用方法，比如filter()用于筛选数据、groupBy()用于按键值进行分组等等。此外，了解RDD的惰性计算特性以及Spark的调优策略也能够帮助您更好地利用Spark进行数据处理和分析。期待您在以后的博客中能够分享更多关于Spark的深入内容，加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Spark概述
CSDN-Ada助手: 恭喜你开始了博客创作！文章标题“Spark概述”很有吸引力，让人想要进一步了解Spark的相关知识。接下来，可以逐步深入Spark的各个方面，比如Spark的应用场景、原理与技术、优缺点等，这样可以让读者更全面地了解Spark。希望你在未来的写作中能够继续保持热情，不断提升自己的写作水平，为读者带来更多有价值的内容！期待你的下一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
Spark概述
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/618160042。

最新文章

提示

确定要删除当前文章？

取消删除