【大数据进击】Spark中的广播变量Broadcast Variable

最新推荐文章于 2023-07-29 10:52:24 发布

及未来

最新推荐文章于 2023-07-29 10:52:24 发布

阅读量541

点赞数

文章标签： Spark broadcast 广播变量

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Jiweilai1/article/details/88384550

版权

官方介绍

A broadcast variable. Broadcast variables allow the programmer to keep a read-only variable cached on each machine rather than shipping a copy of it with tasks. They can be used, for example, to give every node a copy of a large input dataset in an efficient manner. Spark also attempts to distribute broadcast variables using efficient broadcast algorithms to reduce communication cost.

使用背景

在Spark的计算任务中，map, flatmap, reduce等算子操作时往往需要使用到变量；
默认情况下，Driver会将变量传输给每一个task。

实际生产环境时，条件往往是这样的：

task的数量是往往是很多的
大数据任务下使用的变量十分大
这就进而造成：
Driver传输到Task将会占用大量网络带宽，进而影响任务整体速度。

简介

Spark作为一个优秀的大数据计算框架，自然也对这种情况做出了优化。那就是广播变量Broadcast variable,使用广播变量，有以下几个特点：

将广播变量传输一份副本到每个Worker
只读性
如此以来，在每个Worker（节点机器）中，都有一份该变量，计算时task直接从本地获取即可，无需再耗费网络资源，但考虑到高并行时的并发写问题，广播变量只可读，不可写（累加器可写）。

具体使用（Scala版）

创建广播变量

val v2 =  sparkContext.broadcast(v1)

获取广播变量

val v3 = v2.value

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

及未来 CSDN认证博客专家 CSDN认证企业博客

码龄8年

103: 原创

25万+: 周排名

1万+: 总排名

17万+: 访问

: 等级

2391: 积分

258: 粉丝

344: 获赞

27: 评论

346: 收藏

私信

关注

分类专栏

一天一道面试题 39篇
心得随笔 6篇
Kafka 2篇
学习笔记 2篇
设计模式 3篇
Flume 1篇
错误处理 12篇
Web 1篇
数据结构 2篇
Linux命令 5篇
计算机基础 1篇
大数据 11篇
Spark 7篇
Azkaban 3篇
HDFS 2篇
Oracle 5篇
Kettle 6篇
Java 5篇
SQL 3篇
Zookeeper 1篇

最新评论

【大数据面试题】38 说说 Hive 怎么行转列
穷苦书生_万事愁: 博主的这篇文章真是让我对Hive怎么行转列这个话题有了全新的认识。文章中的细节描述非常到位，让我深切感受到博主的深厚功底和专业知识。希望博主能够继续分享更多这样有价值的好文，让我们读者受益匪浅。期待未来能够得到博主的指导，共同进步。非常感谢博主的无私分享和支持！
【大数据面试题】34 手写一个 Flink SQL 样例
普通网友: 写的真好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
【大数据面试题】024 Spark 3 升级了些什么？
普通网友: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
【心得】如何做一个靠谱的程序员
普通网友: 好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
【大数据面试题】022 完成比完美更重要
普通网友: 好文！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。