大数据hadoop之yarn

一、YARN概述

yarn是一个资源调度平台负责为运算程序提供服务器运算资源,相当于一个分布式操作系统平台,mr等程序在上面运行。

二、yarn基本架构

resoucemanage、nodemanage、applicationmaster、container等

三、yarn任务提交流程

  1. mr程序把任务提交到客户端所在节点
  2. 客户端提交给resourcemanage申请一个application
  3. rm返回application路径和资源id,客户端上传文件(xml,切片,jar)到application路径上,
  4. 提交完成后向rm申请applicationmaster(am),
  5. rm将用户请求初始化一个task进入自己的任务调度队列,
  6. 发送task任务到nm
  7. nm创建container,运行applicationmaster
  8. am从路径上下载文件
  9. am向rm申请运行maptask容器
  10. rm向nm分配maptask,nodemanage收到maptask创建container运行maptask
  11. am向其他task发送启动命令
  12. am等待所有maptask执行完成后再向rm申请运行reducetask容器
  13. rm向nm分配reducetask,nodemanage收到reducetask创建container运行reducetask
  14. reducetask向maptask拉取相应分区数据
  15. 程序运行完后am会向rm注销自己

四、yarn调度器

1公平调度器(多队列,同一时间队列可以运行多个任务

2容量调度器(多队列,同一时间队列只能运行一个任务

3FIFO调度器(单队列基本没人用)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值