大数据开发-Spark-闭包的理解

最新推荐文章于 2022-07-01 08:04:45 发布

Hoult-吴邪

最新推荐文章于 2022-07-01 08:04:45 发布

阅读量303

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hu_lichao/article/details/112451982

版权

本文介绍了闭包的概念，从Scala的角度阐述了闭包的定义，并通过示例解释了其工作机制。接着讨论了Spark中闭包的作用，包括如何影响RDD操作的执行，以及在序列化和任务分配过程中的重要性。最后，总结了闭包在Spark生命周期中的关键角色，并提醒读者在使用DataSet时注意闭包的影响。

摘要由CSDN通过智能技术生成

1.从Scala中理解闭包

闭包是一个函数，返回值依赖于声明在函数外部的一个或多个变量。闭包通常来讲可以简单的认为是可以访问一个函数里面局部变量的另外一个函数。

如下面这段匿名的函数：

val multiplier = (i:Int) => i * 10

函数体内有一个变量 i，它作为函数的一个参数。如下面的另一段代码：

val multiplier = (i:Int) => i * factor

在 multiplier中有两个变量：i 和 factor。其中的一个 i 是函数的形式参数，在 multiplier函数被调用时，i 被赋予一个新的值。然而，factor不是形式参数，而是自由变量，考虑下面代码：

var factor = 3  val multiplier = (i:Int) => i * factor

这里我们引入一个自由变量 factor，这个变量定义在函数外面。

这样定义的函数变量 multiplier成为一个"闭包"，因为它引用到函数外面定义的变量，定义这个函数的过程是将这个自由变量捕获而构成一个封闭的函数

完整的例子：

object Test {  
   def main(args: Array[String]) {

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Hoult-吴邪 CSDN认证博客专家 CSDN认证企业博客

码龄7年

92: 原创

7万+: 周排名

93万+: 总排名

9万+: 访问

: 等级

1494: 积分

38: 粉丝

50: 获赞

37: 评论

238: 收藏

私信

关注

热门文章

分类专栏

最新评论

大数据开发-Docker-使用Docker10分钟快速搭建大数据环境,Hadoop、Hive、Spark、Hue、Kafka、ElasticSearch.....
Hoult-吴邪: 可以试试从github自己打包镜像，里面有dockerfile
大数据开发-Docker-使用Docker10分钟快速搭建大数据环境,Hadoop、Hive、Spark、Hue、Kafka、ElasticSearch.....
SmartManWind: 下载速度好慢，可以搞个阿里云的镜像
大数据开发-Nginx&Kafka-Nginx做页面采集, Kafka收集到对应Topic
阿木木_: 怎么将不同模块的请求分发到不同的topic呢？？？根据请求参数？？？
大数据开发-Flink-1.13新特性
微毂: 为啥使用1.13的水印报错了 [code=plain] val loginEventStream: DataStream[LoginEvent] = inputStream .map(data => { val arr = data.split(",") LoginEvent(arr(0).toLong, arr(1), arr(2), arr(3).toLong) }) .assignTimestampsAndWatermarks( WatermarkStrategy .forBoundedOutOfOrderness[LoginEvent](Duration.ofMillis(20)) .withTimestampAssigner(new SerializableTimestampAssigner[LoginEvent] { override def extractTimestamp(element:LoginEvent, recordTimestamp: Long): Long = element.timestamp*1000L }) ) [/code] Error:(23, 48) Static methods in interface require -target:jvm-1.8 .forBoundedOutOfOrderness[LoginEvent](Duration.ofMillis(20))
大数据开发-Spark-闭包的理解
、静寒°: 说得不清不楚，spark闭包与scala闭包本质有什么区别呢

大家在看

Java | Leetcode Java题解之第414题第三大的数 150

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。