GFS 和 MapReduce 的容错机制

冰山三七分

已于 2023-12-22 12:29:37 修改

阅读量137

点赞数

分类专栏：计算机网络文章标签： mapreduce 大数据 googlecloud

于 2023-12-22 12:22:59 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45742778/article/details/135150244

版权

计算机网络专栏收录该内容

3 篇文章 0 订阅

订阅专栏

Google 云计算

GFS

一个 Master ，多个 ChunkServers ，多个 Clients 访问

在这里插入图片描述

文件为什么被分成 64M?

减少 Client 和 Master 的交互
Client 在一个 chuck 中可以做更多事
减少 TCP 三次握手时间

缺点：区域太大，空间会有冗余。

GFS 容错机制

Chunk Server

在这里插入图片描述

Master

在这里插入图片描述

MapReduce

原理

一种分治算法。
（1）分割 (map) 将输入转化，得到键值对。
算法采用分布式的多个 worker (一台主机/服务器），一共有 master, map, reduce 三类，其中 map 在本地进行倒排索引

（2）Master 指定执行 map 和 reduce 任务的主机

（3）Map 主机: 在本机进行倒排索引，将 input 中的接口，转化成 output 需要的接口，读取片段并存储到本地。

（4）Reduce 主机: 从本地进行远程读取，并进行归类处理（哈希取模），将结果写入文件。

Execution overview

容错

Worker – Master 周期性去 ping ，保持连接

Master – 周期性将自己的数据（Map 和 Reduce 任务的状态，Worker 机器标识）写入磁盘（checkpoint）

冰山三七分

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

冰山三七分 CSDN认证博客专家 CSDN认证企业博客

码龄5年

18: 原创

28万+: 周排名

7万+: 总排名

9836: 访问

: 等级

291: 积分

80: 粉丝

103: 获赞

8: 评论

99: 收藏

私信

关注

热门文章

分类专栏

最新评论

Python 单元测试
CSDN-Ada助手: 恭喜您发布了关于“Python 单元测试”的博客，内容相当精彩！持续创作不易，您的努力和热情让读者受益匪浅。希望您能继续保持创作的热情，也可以考虑扩大主题范围，涉及更多 Python 相关的话题，让更多读者受益。期待您的下一篇作品！
pytorch多显卡 ‘torch.DataParallel‘
CSDN-Ada助手: 恭喜您写了第15篇博客，分享了关于pytorch多显卡使用‘torch.DataParallel’的内容。继续保持创作的热情和努力！下一步可以考虑深入探讨pytorch在分布式训练中的应用，或者分享一些实用的调参技巧和经验。期待您更多精彩的文章，加油！祝您写作顺利，学识渊博！
VSCode 修改背景图片
CSDN-Ada助手: 恭喜您第14篇博客！看到您分享了关于VSCode修改背景图片的教程，真的很有帮助。不过我觉得您可以考虑下一步写一些关于VSCode插件的推荐或者使用技巧的文章，相信会吸引更多读者的关注。期待您的下一篇作品！
Python 遍历字典
CSDN-Ada助手: 恭喜您写了第13篇博客，标题为“Python 遍历字典”！您的创作热情令人钦佩，希望您能继续保持下去。对于下一步的创作建议，我建议您可以尝试深入探讨Python中其他常用数据结构的遍历方法，或者结合实际案例分享更多Python编程技巧和经验，期待您的更多精彩内容！
似然函数与参数估计
CSDN-Ada助手: 恭喜您撰写了第12篇博客！标题"似然函数与参数估计"听起来很有深度。您在探讨似然函数与参数估计方面的知识，为读者提供了宝贵的学习资源。您的文章内容清晰易懂，让读者能够更好地理解这个主题。在下一篇博客中，或许您可以进一步探讨如何在实际问题中应用似然函数与参数估计的方法，或者分享一些实际案例，这将使文章更加生动且具有实用性。期待您的进一步创作！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。