applicationmaster故障后如何处理

最新推荐文章于 2023-12-19 20:36:53 发布

等你下课_

最新推荐文章于 2023-12-19 20:36:53 发布

阅读量778

点赞数

分类专栏： YARN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39950222/article/details/100629735

版权

YARN 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

MRAPPMaster向resourcemanager发送周期性的心跳报告。当resourcemanager发现MRAPPMaster故障时，会在一个新的容器(由节点管理器管理)开始一个新的MRAPPMaster实例，新的MRAPPMaster实例可以恢复故障任务的状态，使其不必重复运行，默认是不恢复，可设置。客户端是会通过心跳周期性的向MRAppMaster获取进度轮询，当MRAPPMaster故障，客户端会重新定位新的MRAPPMaster实例位置。

客户端定位MRAPPMaster的过程为：

在作业初始阶段，客户端会向resourcemanager询问并缓存MRAPPMaster的位置，使其每次向MRAPPMaster查询时不需要重新载入resourcemanager，但是mrappmaster运行失败，客户端不能获得进度状态时，会重新向resourcemanager询问。

节点管理器运行实败：节点管理器会停止向resourcemanager 发送心跳，并被移除可用节点管理器池

对于resourcemanager，可以通过zookeeper实现HA，避免一个resourcemanager出现单点故障，其脑裂问题是由zookeeper的ACL来实现的。YARN的单点故障指的是ResourceManager单点问题

ResounceManager 负责整个系统的资源管理和调度

内部维护了各个应用程序的applicationmaster信息、nodemanager信息、资源使用信息等。

考虑到这些信息绝大多数可以动态重构，因此解决YARN单点故障要比HDFS单点容易很多。

与HDFS 类似

YARN的单点故障仍然由主备切换的方式完成，不同的是，备节点不会同步主节点的信息，而是在切换之后，才从共享存储系统读取所需信息。是因为YARN resourcemanager内部保存的信息非常少，大部分可以重构，而且这些信息是动态变化的。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
applicationmaster故障后如何处理

MRAPPMaster向resourcemanager发送周期性的心跳报告。当resourcemanager发现MRAPPMaster故障时，会在一个新的容器(由节点管理器管理)开始一个新的MRAPPMaster实例，新的MRAPPMaster实例可以恢复故障任务的状态，使其不必重复运行，默认是不恢复，可设置。客户端是会通过心跳周期性的向MRAppMaster获取进度轮询，当MRAPPMaster...
复制链接

扫一扫

专栏目录

等你下课_ CSDN认证博客专家 CSDN认证企业博客

码龄7年

80: 原创

34万+: 周排名

168万+: 总排名

3万+: 访问

: 等级

1023: 积分

6: 粉丝

5: 获赞

4: 评论

40: 收藏

私信

关注

热门文章

分类专栏

杂七杂八 1篇
JVM 1篇
spark 6篇
算法 8篇
Hbase 13篇
Hive 1篇
YARN 8篇
HDFS 13篇
mapreduce 12篇
RPC协议
数据结构 2篇
javase 15篇
计算机基础

最新评论

请描述如何解决Hbase中region太小和region太大带来的冲突.
高性能服务器: Region 过大会发生多次 compaction，将数据读一遍并重写一遍到 hdfs 上，占用 io，region 过小会造成多次 split，region 会下线，影响访问服务，最佳的解决方法是调整 hbase.hregion. max.filesize 为 256m。
yarn内存和cpu的资源调度(管理)和资源隔离机制
qq_35886845: fork() + exec()创建子进程理论上不会直接copy整个内存块吧，应该是copy on write的机制，实际测试中也没发现加倍的情况，作者是否写的有问题？超过内存预定上限的情况应该是调用外部脚本，比如python脚本之类的，这种脚本不受jvm限制，可以瞬间打爆内存。
请描述如何解决Hbase中region太小和region太大带来的冲突.
骨咕孤谷: 你这个完全瞎写的吧，怎么会是调整到256M这么小呢，一般都是调整到5-10G，默认是10个G大小
原码，补码，反码。左移、右移、无符号右移，异或运算^、或运算|
weixin_43892890: 正数：原码=补码=反码

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。