MapReduce的容错机制

最新推荐文章于 2023-12-21 16:37:12 发布

limn2o4

最新推荐文章于 2023-12-21 16:37:12 发布

阅读量714

点赞数

分类专栏： Hadoop and Spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lingzidong/article/details/87308676

版权

Hadoop and Spark 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

MapReduce是如何错的

由于mapreduce要处理海量的数据，需要驱动成千上百的节点，如果节点出了问题，要如何处理呢？

worker节点出现故障

对应到hadoop mapreduce，就是在datanode上运行的worker出现了故障。解决的方法是master节点定期ping slave节点，如果收不到这个节点返回的信息，那么这个slave节点就会被标记失效，这个节点的任务就由其他的空闲节点完成。
当 worker 故障时，由于已经完成的 Map 任务的输出存储在这台机器上，Map 任务的输出已不可访问了，因此必须重新执行。而已经完成的 Reduce 任务的输出存储在全局文件系统上，因此不需要再次执行。
同时，由于Reducer需要得知Mapper保存的数据的地址，当一个Mapper失效之后，这个Mapper的任务交给其他节点运行的时候，所有的节点都会被通知，防止有节点从这个节点获取信息。

master节点出现故障

master需要定期将master维护的数据定期保存在其他的节点。也就是chekpoint，如果这个节点出现了故障，就会从这个checkpoint来恢复。开始启动新的master进程。
最好还是在master节点发生故障的时候，就终止mapreduce计算，因为master进程一般只启动一个。

（mapreduce论文）http://blog.bizcloudsoft.com/wp-content/uploads/Google-MapReduce中文版_1.0.pdf

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MapReduce的容错机制

MapReduce是如何错的由于mapreduce要处理海量的数据，需要驱动成千上百的节点，如果节点出了问题，要如何处理呢？worker节点出现故障对应到hadoop mapreduce，就是在datanode上运行的worker出现了故障。解决的方法是master节点定期ping slave节点，如果收不到这个节点返回的信息，那么这个slave节点就会被标记失效，这个节点的任务就由其他的空...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。