Hadoop作业性能指标及参数调优实例 (三)Hadoop作业性能参数调优方法

本文详细介绍了Hadoop作业性能调优的两种场景,包括使用eBay Eagle作业性能分析器进行异常指标分析和提供7个调优建议。另外,还讨论了在特定情况下如何调整Splitmetainfo文件上限、复制因子、locateFollowingBlock重试次数、timeout阈值和内存等参数以优化性能。此外,强调了作业日志管理和避免因性能问题引发集群事故的重要性。
摘要由CSDN通过智能技术生成

作者: Shu, Alison 

Hadoop作业性能调优的两种场景:

一、用户观察到作业性能差,主动寻求帮助。

(一)eBayEagle作业性能分析器

1. Hadoop作业性能异常指标

2. Hadoop作业性能调优7个建议

(二)其它参数调优方法

二、Hadoop集群报告异常,发现个别作业导致集群事故。

 

一、用户观察到作业性能差,主动寻求帮助。

(一)eBay Eagle作业性能分析器

对一般作业性能调优,eBay Eagle[i]的作业性能分析器已经能满足用户大部分需求。eBayEagle作业性能分析包含两个部分,第一部分是根据定量指标,捕捉性能异常的作业。在本文中,我们不考虑Hadoop集群或者节点故障造成作业性能的普遍下降,因此我们认为这些性能指标异常只与Hadoop作业有关,可以通过性能调优来改善。第二部分是调优建议。根据Hadoop作业性能异常指标判断作业是否需要调优,再综合采用第二部分的建议。第二部分也可以作为Hadoop作业开发的指引,并在后期性能测试中检查。

 

1. Hadoop作业性能异常指标

参阅《Hadoop作业性能指标及参数调优实例(一)Hadoop作业性能异常指标》

 

2. Hadoop作业性能调优的7个建议

参阅《Hadoop作业性能指标及参数调优实例(二)Hadoop作业性能调优7个建议》

 

(二)eBay Eagle作业分析器之外,我们仍然发现一些简单有用的参数调优办法。

§  提高Splitmetainfo文件上限以应对输入文件包含大量小文件及文件目录

示例:

$yarn logs -applicationId application_1431213413583_263303-appOwner abc

2015-06-02 11:15:37,971 INFO [main]org.apache.hadoop.service.AbstractService: Serviceorg.apache.hadoop.mapreduce.v2.app.MRAppMaster failed in state STARTED; cause:org.apache.hadoop.yarn.exceptions.YarnRuntimeException: java.io.IOException:Split metadata size exceeded 10000000. Aborting job job_1431213413583_263303

分析:

输入文件包括大量

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值