Hadoop基于Yarn的MapReduce架构

    基于Yarn的MapReduce架构

    1.MapReduce程序是基于Mapper和Reducer两大阶段构成的,其中Mapper是把一个计算任务分成很多小任务进行并行计算,Reducer是做最后的统计工作的;
    2.Hadoop2.x开始MapReduce的运行是基于Yarn进行的:
   
    3.当ResourceManager接受到Client提交程序的请求的时候,会根据集群资源的状况在每个NodeManager所在的节点上命令Nodemanager来启动该程序的第一个Container,该Container(Container是CPU、内存资源的封装)就是该程序ApplicationMaster,负责该程序的任务调度的执行过程,ApplicationMaster转过来向ResourceManager注册自己,注册之后会向ResourceManager申请具体的Container计算资源,如果资源(Container)充足,可以一次分配,如果资源(Container)不够,ResourceManager发现有可用资源就会再次分配;

    
    4.如何知道一个程序中的ApplicationMaster需要多少个Container?ApplicationMaster在启动的时候会运行程序的main方法,该方法中会有数据的输入和相关的配置,通过这些内容就可以知道需要多少Container;
    5.MapReduce运行在Yarn上的总结
        主从结构
            主节点,只有一个:ResourceManager
            控制节点,每一个job都有一个MRAppMaster
            从节点,有多个:YarnChild
        ResourceManager负责:
            负责每一个job执行的任务调度
            把job分给MRAppMaster执行
            监控MRAPPMaster的执行情况
        MRAppMaster负责
            负责每一个job执行的任务调度
            把job分给YarnChild执行
            监控YarnChild的执行情况
        YarnChild负责
            执行MRAppMaster分配的计算任务
    6.Hadoop中的MapReduce中的MRAppMaster相当于Spark中的Driver,Hadoop MapReduce中的YarnChild相当于Spark中的CoarseGrainedExecutorBackend;

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值