YARN - Task, Node manager, AppMaster, Resource manager 失败时所做的处理

本文详细介绍了YARN中Task、Application Master、Node Manager和Resource Manager在失败时的处理方式,包括任务重试策略、AppMaster恢复机制、Node Manager故障处理以及Resource Manager的高可用性方案。
摘要由CSDN通过智能技术生成

本文为《 Hadoop 权威指南第四版 》(英文原版) 读书笔记,仅限交流使用,转载请注明出处,多谢。

YARN - 失败时所做的处理

Henvealf/文

YARN 的失败总共包含四种实体的失败:task,application master,node manager 和 resource manager。

Task 失败

task 的运行也都会称为 尝试(attempt) task。可以理解为 task 的运行被认为是试试看看,不能保证一定会成功。

task 失败的第一种情况就是用户的 map task 或者 reduce task 代码在执行的之后抛出了运行时异常。如果发生了,就做以下操作:

  • task JVM 会在退出之前报告失败给他的 AppMaster。
  • 错误会立刻写进用户的日志中。
  • AppMaster 将 task 标记为 fail。
  • 释放 task 的容器,以留给其他的 task 使用。

对于 Streaming task,如果程序执行的退出码是 0,就将其标记为 fail。这个行为是使用 stream.non.zero.exit.is.failure 属性来设置的。

task 失败的另一种情况就是 JVM 意外的退出 – 可能是因为 MapReduce 用户配置的环境导致了 JVM 出现了 bug。 在这种情况下,

  • node manager 注意到处理已经退出,就报告给 AppMaster。
  • AppMaster 就会将 task 标记为 failed。

挂起的 task 使用不同的方式处理。

  • Ap
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值