Spark shuffle调优

本文主要探讨了如何对Spark的shuffle过程进行优化,包括优化前后shuffle写入数据的对比,RDD压缩以降低shuffle write的大小,以及Kryo注册和序列化缓存的详细步骤,通过这些方法提升Spark作业的性能。
摘要由CSDN通过智能技术生成

一、优化前:

shuffle写的比例为输入数据的1.5倍:
在这里插入图片描述

二、优化后:

在这里插入图片描述

三、RDD压缩

spark.shuffle.compress
序列化后,shuffle write仍然较大,考虑压缩
sparkConf.set("spark.rdd.compress", "true")

四、序列化优化

4-1、kyro注册

sparkConf.registerKryoClasses(Array(classOf[org.apache.hadoop.hbase.io.ImmutableBytesWritable],classOf[org.apache.hadoop.hbase.client.Put],classOf[org.apache.hadoop.hbase.client.Result]))

kryo官方的一个例子

import com<
Figma是一种设计工具,而Figma插件可以将HTML转换为Figma或将Figma设计转换为代码。要使用这个插件,首先在Figma中打开一个新的或现有的文档,然后按下cmd/键并搜索"html figma",然后按Enter。接下来,您可以输入要导入的URL,将其转换为Figma设计。 此外,还有一个叫做"镀Chrome"的插件,它可以将Figma页面的原型从浏览器中打开的当前文件导出为静态的HTML文件,并使用图像映射链接。但在使用之前,请确保在扩展选项页面中设置了您的Figma个人访问令牌。通过这种方式,您可以模拟Figma的一些交互效果,比如"后退"交互,通过在元素名称中进行设置。<span class="em">1</span><span class="em">2</span> #### 引用[.reference_title] - *1* [html-figma:用于将HTML导入到Figma层的插件](https://download.csdn.net/download/weixin_42127748/14959063)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [ChromedFigma:Figma html导出chrome扩展](https://download.csdn.net/download/weixin_42138780/14959285)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值