MapReduce on Yarn

MapRduce

MapReduce是一个软件框架,基于该框架能够容易地编写应用程序,这些应用程序能够运行在由上千个商用机器组成的大集群上,并以一种可靠的,具有容错能力的方式并行地处理上TB级别的海量数据集。

MapReduce的思想就是“分而治之”:
Map(映射):把复杂的任务分解为若干个“简单的任务”来处理。
Reduce(规约):把map阶段的结果进行汇总。
在这里插入图片描述
实体一:客户端,用来提交MapReduce作业。

实体二:JobTracker,用来协调作业的运行。

实体三:TaskTracker,用来处理作业划分后的任务。

实体四:HDFS,用来在其它实体间共享作业文件。

但是,MapReduce缺点十分明显,基于磁盘,计算慢,而且需要开发java代码。

Yarn

1). ResourceManager 资源作业管理者
Applications Manager 作业管理(管理各种作业申请)
Resource Scheduler 资源调度

2). NodeManager 节点管理者上面有很多容器。
容器:Yarn的资源的抽象的观念

  1. 在 nodemanager节点机器上的
  2. 虚拟的概念
  3. 将一定大小的内存和cpu vcore组成的最小单元(虚拟core,用虚拟core表示是考虑到不同节点的cpu性能不一样,每个cpu的计算能力也不同)
  4. 运行task

MapReduce on Yarn

这三个其实是一个问题:
mr job执行流程
mr on yarn架构
yarn架构设计
job app application 都指的是作业。MapReduce中的map , reduce 都属于 task(task是运行计算任务,在container容器中。)job app application 都指的是作业
在这里插入图片描述
MapReduce ApplicationMaster:是指MR的应用程序的主程序,主要负责程序的监控状态,重启失败的任务

  1. 用户通过client向Yarn提交应用程序(job),交给老大ResourceManager的ApplicationsManager,其中包括applicationMaster程序(job的主程序,引导程序),启动applicationMaster命令等
  2. ResourceManager为该job分配第一个容器,并与对应的NodeManeger通信,要求它在这个容器中去启动job的MapReduce applicationMaster程序(MR的引导程序)
  3. ApplicationMaster首先向Applications Manager注册,告诉老大我在这边成功了。用户就可以直接在web界面查看job的整个运行状态和日志。
  4. ApplicationMaster再去向Resource Scheduler 采用轮询(如果申请不到足够的资源,先申请一些运行着。运行完释放了,再继续申请)的方式通过RPC协议去申请和领取资源列表
  5. 一旦ApplicationMaster申请到资源的后,便与对应的NM节点通信(可以与自己的nodemanager也可以与别人nodemanager),要求启动任务。
  6. NM为任务task设置好运行环境(环境变量、jar包等),将任务的启动命令写在一个脚本文件中,并通过这个脚本启动任务,运行各个map task,reduce task。
  7. 各个task通过rpc向applicationMaster汇报自己的状态和进度,以让applicationMaster随时掌握各个任务的运行状态,从而可以在任务运行时重新启动任务。web界面可以实时查看job的当前的运行状态。
  8. ApplicationMaster 向 ApplicationsManager 报告,成功后,注销并关闭自己

其实就分为两个阶段:
1). 启动ApplicationMaster
2). 由ApplicationMaster创建job,为他们申请资源,并监控他们的整个运行过程,直到运行结束。

Yarn调度器

job 去调度 申请资源
规则:
FIFO 先进先出 先来的先拿资源,直到第一个Job做完再做第二个后来的Job
Capacity 计算 会造成资源的浪费 因为系统会空出一部分资源给小任务
不管有没有,这部分都会预留着
Fair 公平调度器,既考虑了小作业及时完成,也不浪费资源 生产上常用这种方法
这种模式下,并不需要预先占用系统资源,调度器为所有的任务动态调度资源
但是从第二个任务提交到获取资源会有一定的延迟,因为需要等待第一个任务释放占用的
container容器

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值