文章目录
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/8c135db34683673fe4068a7510b00285.png)
神秘代码:5Lmd5biI5YWE5ZSv5LiA5Y6f5Yib5paH56ug77yM56aB5q2i6L2s6L29LOmSiemSiToxNTA1NzE3MDA1OSzllpzmrKLop6PlhrPpl67popjvvIzlj6/ku6XlhY3otLnpl67pl67popg=
1.概述
我们在文章 【Yarn】 Yarn ResourceManager 重启机制 中我们学到了ResourceManager Restart重启机制是使RM在重启动时能够使Yarn集群正常工作的特性,并且使RM的出现的失败不被用户知道。
然后我就看到这篇文章:YARN容错机制-hadoop 这篇文件对容错机制有了进一步的解释。
在现实情况中,用户代码错误不断,进程奔溃,机器故障等等。使用hadoop的好处之一就是可以它能处理这类故障并成功完成任务。需要考虑的实体失败任务为:任务(job),Application Master,NodeMa