Hadoop2.0 YARN

前言:Hadoop2.0中的YARN

YARN产生背景

第一代MapReduce(MRv1)的局限性

  1. 扩展性差。MRv1中JobTracker兼备集群资源的管理和作业管理的调度和控制两大功能,使得JobTracker功能多,负载大

  2. 可靠性差。

  3. 资源利用率低。MapSolt和ReduceSolt不能混用,存在一个槽位资源紧张,而另一个操作资源空闲

  4. 无法支持多种计算框架。因为Hadoop1.0不能将资源管理与应用程序分开

  5. 非MapReduce作业

将资源管理功能抽象成一个独立的通用系统YARN(Yet Another Resource Negotiator,另一种资源协调者),进而诞生下一代MapReduce计算框架MRv2

YARN的优势

  1. 共享集群资源。

  2. 节约成本。多个框架一个集群,集群数量减少,人力资源成本减少

  3. 共享数据

YARN架构

组成

  1. 全局资源管理器

  2. 阶段管理器

  3. 应用程序主机

  4. 容器(Container)。YARN中的资源抽象,可动态调整;计算任务运行在container中

  5. YARN通信协议-RPC协议(网络协议,通讯协议+寻址+数据序列化),为与互联网兼容

任务执行流程

当用户向YARN中提交一个应用程 序后,YARN将分两个阶段运行该应用程序:

  1. 第一个阶段是启动Application Master;

  2. 第二个阶段是由Application Master创建应用程序,为它申请资源Container,并监控它的整个运行过程,直至运行完成为止

调度器

  1. FIFO调度器。队列,弊端:大任务会占用集群资源,阻塞小任务的执行
  2. 计算能力调度器。分区队列。创建多个队列,划分不同资源
  3. 公平调度器。为所有运行的应用程序公平分配资源
    阻塞小任务的执行
  4. 计算能力调度器。分区队列。创建多个队列,划分不同资源
  5. 公平调度器。为所有运行的应用程序公平分配资源
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值