mit6.824之MapReduce

最新推荐文章于 2024-07-29 21:33:23 发布

ocean1992

最新推荐文章于 2024-07-29 21:33:23 发布

阅读量689

点赞数

分类专栏：开发常用知识

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ocean1992/article/details/79948004

版权

本文介绍了mit6.824分布式系统课程中的MapReduce系统，详细阐述了MapReduce的执行流程、容错机制以及系统优化措施。MapReduce通过Map和Reduce两个阶段处理数据，容错机制确保任务在worker节点故障时能继续执行。系统优化包括利用数据局部性、动态调整M和R的值以及使用本地Combiner减少网络传输。此外，文中还提及了实验室练习Lab1的目标。

摘要由CSDN通过智能技术生成

mit6.824：MapReduce系统

最近决定开始学习mit6.824 Distributed Systems课程，主要包括阅读论文，课堂笔记和完成project，内容均在mit6.824 课程主页上找到。第一部分是经典的MapReduce系统设计，通读MapReduce论文，在此总结记录个人认为MapReduce设计的要点。

MapReduce执行流程
Fault Tolerance(容错机制)
MapReduce 系统优化

MapReduce执行流程

MapReduce包括Map和Reduce两部分，具体的执行流程如下图（from MapReduce osdi04）所示。MapReduce运行于由大量PC或者server组成的Google File System (GFS)集群上。集群中的节点分为Master和Worker两种。

MapReduce Execution Process

当User Program向Master节点提交一个任务后，Master节点会向M个Worker节点分发任务信息，每个worker节点会从GFS读取相应的文件，并调用相应的map函数执行，在map任务都执行完毕后，进入Reduce阶段。Master节点向worker节点分配Reduce任

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。