Spark的函数式编程

最新推荐文章于 2023-09-20 11:14:01 发布

置顶

碧茂大数据

最新推荐文章于 2023-09-20 11:14:01 发布

阅读量1.6k

点赞数

分类专栏： Hadoop 文章标签： spark Hadoop 大数据函数编程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dashujuedu/article/details/54616256

版权

本文探讨了Spark作为分布式并行数据处理框架的函数式编程特性。内容包括Spark依赖函数单元的原因，如何将函数作为参数传递，特别是匿名函数的使用。通过Python、Scala和Java的示例展示了RDD的map操作，强调了Spark中函数编程的重要性及其在大数据处理中的应用。

摘要由CSDN通过智能技术生成

Spark是近年来发展较快的分布式并行数据处理框架，了解和掌握spark对于学习大数据有着至关重要的意义。但是spark依赖于函数单元，它的函数编程过程是怎样的呢？我们怎么来应用呢？

一、Spark的函数式编程

Spark依赖于函数单元，函数是其编程的基本单元，只有输入输出，没有state和side effect。它的关键概念就是把函数作为其他函数的输入，不过在使用函数的过程中使用的都是匿名函数，因为这个函数只是满足当下计算，因此不需要固化下来进行其它应用。

二、把函数作为参数传递

很多RDD操作把函数作为参数传递，这里我们看一下RDD map操作伪代码，把函数fn应用到RDD的每条记录。但这并不是它执行的一个真正的代码，只是通过这个代码去看一下它处理的逻辑。

最低0.47元/天解锁文章

碧茂大数据

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。