基于yarn的Hadoop调优

Hadoop2推出yarn作为资源管理器,它借鉴了mesos的思想为上层应用提供统一的资源管理和调度。首先ResourceManager(RM)通过NodeManager(NM)不断得到集群整体资源的视图,这些资源包括CPU、内存等,而且是以Container的形式表现的。ApplicationMaster对应用户提交的应用,比如MapReduce,这一计算Job的数据分布在若干节点上,它首先通过RM了解数据所在节点的资源情况,一旦获得满足要求的Container,即与此节点上的NM通讯并启动相应的计算任务。相较于Hadoop1,PM与AM分别承担了NameNode分配资源和完成计算任务的两大职责,并将二者加以分离。

Yarn表示资源利用不再简单的以slot为单位来考量,而是综合CPU、内存等所有可用资源,但是我们的计算任务,比如MapReduce依然需要通过map/reduce的Task 总数来衡量所需资源,进而通过优化blocksize、spill、buffer、merge等相关参数来优化Hadoop集群的性能。这些优化就是对通过Container获取到的资源更加合理充分的使用,最大限度的提高系统的吞吐量。

综合上述,对Hadoop2的优化分为两部分,分别为Yarn和传统的HDFS、Mapred。那么,对于Spark而言也是如此,Yarn相关参数的设置和优化并不涵盖对计算任务如何有效使用资源的优化。当然,Yarn的推出使得Hadoop可以支持更多类型的计算任务。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值