yarn作业提交过程以及常用命令

本文介绍了YARN在Hadoop2.x中的角色,详细解析了YARN作业的提交过程,包括作业初始化、任务分配和运行,以及常用管理命令。YARN作为通用资源管理系统,提升了集群利用率和数据共享效率。
摘要由CSDN通过智能技术生成

1、yarn简介

  • 1、Hadoop1.x版本中最大的问题是资源问题
    • 对数据的处理和资源调度主要依赖MapReduce完成,只能运行MapReduce程序
    • JobTracker负责资源管理和程序调度,压力较大
  • 2、Hadoop2.x版本添加YARN
    • 主要负责集群资源管理
  • 3、YARN(Yet Another Resource Negotiator)核心思想是将资源管理和任务的监控和调度分离
    • 通用的资源管理系统,可为不同的应用(MapReduce、Spark、Flink等)提供统一的资源管理和调度
    • 它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处

3、yarn作业提交过程

在这里插入图片描述
1.作业提交

  • (1)client调用job.waitForCompletion 方法,向整个集群提交MapReduce作业

  • (2)client向ResourceManager申请一个作业id

  • (3)ResourceManager 给 Client 返回该 job 资源的提交路径(HDFS 路径)和作业 Id,每一个作业都有一个唯一的 Id。

  • (4)Client 发送 jar 包、切片信息和配置文件到指定的资源

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值