对The Google File System阅读介绍(阅读笔记)

GFS是一个针对大规模数据密集型应用设计的分布式文件系统,适用于大文件的顺序读写。其设计考虑了组件失效的常态,支持多客户端并行追加数据,重视高带宽而非低延迟。GFS由一个master节点、多个chunkserver和客户端组成,文件被切分成固定大小的chunk并复制以保证可用性和可靠性。系统采用租约机制、心跳通信和日志记录实现一致性保障和容错。
摘要由CSDN通过智能技术生成

1.什么是GFS:

GFS是一个面向分布式数据密集型应用的、可伸缩的分布式文件系统,主要适用于大文件的顺序读取以及追加写操作。

2.为什么设计GFS:

为了满足Google迅速增长的数据处理需求。现在以及可预见的将来都反映出,分布式文件系统将面临文件大、多,数据增长快,用户访问多的情形。

3.GFS有哪些方面的设计概述:

 * 组件失效被认为是常态事件,而不是意外事件。因此,持久的监控、错误侦测、容错以及自动恢复必须集成在系统中。

 * 系统存储一定数量的大文件。

 * 系统的工作负载主要由两种读操作组成:大规模的流式读取和小规模的随机读取。

 * 绝大部分文件的变更是采用在文件尾部追加新数据(append操作),而不是重写原有数据的方式。

 * 系统必须高效的、定义明确的实现多客户端并行追加数据到同一个文件里的语意。

 * 高可持续的网络带宽比低延迟更重要。

4.GFS的架构:

 * 一个GFS 集群包含一个单独的master节点和多台chunkserver,并且被多个客户端(Client)访问。

 * 一份文件被分为多个固定大小的chunk(默认64M,有优点也有缺点),每个chunk有全局唯一的文件句柄 (一个64位的ch

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值