【Hadoop入门学习系列之三】YARN原理和资源调度

本文详细介绍了Hadoop YARN的产生背景、基本架构、资源调度,包括ResourceManager、NodeManager、ApplicationMaster和Container的角色。此外,讨论了YARN的容错性、调度框架、资源调度器和计算框架如MapReduce、Tez、Storm和Spark在YARN上的运行。YARN作为统一资源管理系统,支持多计算框架的兼容与资源共享,提升了资源利用率和运维效率。
摘要由CSDN通过智能技术生成

一.Hadoop YARN产生背景

  • Mapreduce1.0版本固有的问题
    这里写图片描述

    • 扩展性受限
    • 单点故障
    • 难以支持MR之外的计算
  • 资源利用率
    这里写图片描述
  • 运维成本和数据共享【多计算框架各自为战,数据共享困难】
    •  MR:离线计算框架
       Storm:实时计算框架
       Spark:内存计算框架
    • 运维成本 如果采用“一个框架一个集群”的模式,则可能需要多个管理员管理这些集群,进而增加运维成本, 而共享模式通常需要少数管理员即可完成多个框架 的统一管理。
  • 数据共享
    • 随着数据量的暴增,跨集群间的数据移动不仅需花 费更长的时间,且硬件成本也会大大增加,而共享集群模式可让多种框架共享数据和硬件资源,将大大减小数据移动带来的成本。

二. Hadoop YARN基本构成与资源调度

1.YARN基本架构

  • YARN基本架构
    这里写图片描述
  • ResourceManager
    • 整个集群只有一个,负责集群资源的统一管理和调度
    • 详细功能
      处理客户端请求
      启动/监控ApplicationMaster
      监控NodeManager
      资源分配与调度
  • NodeManager
    • 整个集群有多个,负责单节点资源管理和使用
    • 详细功能
      单个节点上的资源管理和任务管理
      处理来自ResourceManager的命令
      处理来自ApplicationMaster的命令
  • ApplicationMaster
    • 每个应用有一个,负责应用程序的管理
    • 详细功能
      数据切分
      为应用程序申请资源,并进一步分配给内部任务
      任务监控与容错
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值