Spark性能调优2-总结分享

本文分享了针对Spark 2.0.2在Hadoop 2.6.0环境下的性能调优经验,调优结果显示,理想情况下性能可提升50%至300%。调优内容涵盖数据本地性、存储格式、计算资源、并行度、内存管理、代码优化等方面,旨在提高CPU利用率,降低IO,提高缓存命中率。文章提供了针对Spark Thriftserver的调优参数建议,并指出并非所有参数都有显著效果,建议根据具体SQL情况进行调整。
摘要由CSDN通过智能技术生成

1、Spark调优背景

目前Zeppelin已经上线一段时间,Spark作为底层SQL执行引擎,需要进行整体性能调优,来提高SQL查询效率。本文主要给出调优的结论,因为涉及参数很多,故没有很细粒度调优,但整体调优方向是可以得出的。

环境:服务器600+,spark 2.0.2,hadoop 2.6.0

2、调优结果

调优随机选取线上9条SQL,表横轴是调优测试项目,测试在集群空闲情况下进行,后一个的测试都是叠加前面测试参数。从数据可参数经过调优,理想环境下性能可提高50%到300%

#3、 下面为调优分享PPT
####1)一图概览
这里写图片描述

####2) Spark集群优化——数据本地性
这里写图片描述

####3)Spark集群优化——存储格式选择
这里写图片描述

####4)Spark参数优化——计算资源

  • 1
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值