spark之共享数据(广播变量详细图解)

广播变量:

比如数据库中一份公共配置表格需要同步给各个节点进行查询

广播变量允许程序缓存一个只读的变量在每台机器上面而不是每个任务保存一份拷

例如利用广播变量我们能够以一种更有效率的方式将一个大数据量输入集合的

副本分配给每个节点。Spark也尝试着利用有效的广播算法去分配广播变量以减少通

信的成本

 

一个广播变量可以通过调用SparkContext.broadcast(v)方法从一个初始变量v中创建广

播变量是v的一个包装变量它的值可以通过value方法访问下面的代码说明了这个过

WordCount程序



广播变量图解:

广播变量之hive优化


评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值