1. 什么是GFS?
首先,我们从 GFS 的定义:“Google File System (GFS) is a scalable distributed file system (DFS) created by Google Inc. and developed to accommodate Google’s expanding data processing requirements. GFS provides fault tolerance, reliability, scalability, availability and performance to large networks and connected nodes . ” 。当中我们可以非常明确看到 GFS区别于Ceph和SWift的核心在于它是一个文件系统,但是这个文件系统又是区别于我们Linux操作系统上普通的EXT文件系统,它具有分布式架构,因此它被赋予了以下特性 :
(1) 扩展性 ( Scalability ) :它具备较强的架构扩展性,可以使得数据规模很容易扩展到PB级别;
(2) 高可用( availability ):它具备较强的集群高可用性,能解决节点故障对集群的可用性影响 ;
(3) 容错性 ( Fault Tolerance ):它具备很强的数据容错性,能解决数据错误的问题 ;
除此之外,我们还要知道它的来源,它是谷歌的杰出作品,是谷歌三驾马车(GFS、Big Table、Mapreduce)三个当中的一个,而且对应着谷歌著名的三篇论文当中的一篇,支持所有谷歌服务的基石。接下