分布式系统：GFS

最新推荐文章于 2022-11-29 13:46:53 发布

颛顼子

最新推荐文章于 2022-11-29 13:46:53 发布

阅读量410

点赞数

文章标签：分布式 6.824

本文链接：https://blog.csdn.net/hohomi77/article/details/100685456

版权

GFS是Google设计的分布式文件系统，旨在利用廉价硬件构建高可用系统，尤其适合大规模顺序读写操作。系统中有一个master节点管理元数据，多个chunkserver存储数据并有副本机制。写操作通过primary replica协调，读操作直接从任何副本读取。故障容忍通过版本号和心跳检测实现。设计重点在于数据流与控制流的分离，以及在网络传输中的优化。

摘要由CSDN通过智能技术生成

为什么要读GFS的论文？

MapReduce用的文件系统。
6.824的很多主题在本文中出现
- 实现细节——从应用程序（校验、去重）到网络传输(就近线性接力传输)的各种细节
- 故障容忍
- 性能——规模化（scale）
- 一致性——本文是对目录树提供强一致性，对文件内容提供弱一致性。
- trade-off：拿一致性换取简单和高性能。以及一些设计上的选择。
影响深远
- 很多其他系统用GFS (e.g., Bigtable, Spanner @ Google)
- HDFS (Hadoop Distributed File System) 也是参照 GFS 设计的。

作者想达成什么目标？

用廉价的大众商品级硬件打造一个高可用的文件系统
应对节点故障，因为节点故障是常态。
侧重读写的持续的流量，而不是较小的延迟。
它是针对特定应用（比如MapReduce）开发的文件系统：这些应用的特点是，读操作常常是顺序地读大量内容（也有随机位置读少量数据），写操作常常是append（在文件末尾追加）记录。

两种节点

GFS把文件分成一个个64M大小的"大块"（chunk）来存储。每个chunk都有唯一的ID
Master节点: 为了设计简单，只有一个master节点。m

最低0.47元/天解锁文章

颛顼子

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
分布式系统：GFS

为什么要读GFS的论文？MapReduce用的文件系统。6.824的很多主题在本文中出现实现细节——从应用程序（校验、去重）到网络传输(就近线性接力传输)的各种细节故障容忍性能——规模化（scale）一致性——本文是对目录树提供强一致性，对文件内容提供弱一致性。trade-off：拿一致性换取简单和高性能。以及一些设计上的选择。影响深远很多其他系统用GFS (e.g.,...
复制链接

扫一扫