企业级分布式文件系统GlusterFS
2003年,Gluster公司参加了一个研制超级计算机的项目,该项目隶属于美国能源部所属的一个国家实验室,代号为Thunder 的超级计算机于次年研制成功并投入生产,成为当年世界上排名第二的超级计算机。在这个过程中,Gluster 公司积累了丰富的高性能分布式文件系统的研发经验,最终于2007年发布了开源的GlusterFS文件系统,这个新的分布式文件系统也成为除Lustre外的一个新选择。
GlusterFS 的最初设计目标是简单方便、高性能及高扩展能力,具体表现为以下几个方面。
- 所有模块都运行在Linux用户态,不涉及Linux内核代码,方便编译、安装及使用(与Lustre不同)。
- 消除了集中化的元数据服务器,从而具备更强的弹性扩展能力及更高的性能(与Lustre不同)。
- 采用模块化设计,简化了系统配置并减少了组件之间的耦合性。
- 使用操作系统自身的文件系统,不重新发明轮子(与 Lustre不同)。
- 数据被存储为标准Linux文件,不引入新格式。
GlusterFS比较突出的一个特点就是上述最后一条。在GlusterFS集群里,我们所存储的文件就位于某个服务器节点上,文件名就是我们指定的文件名,内容就是我们写入的内容,这个文件没有经过任何特殊的加密或编码,我们可以直接用Linux文件命令对其进行操作。因此,即使GlusterFS集群出现故障而导致不可用,所有文件也都在原地,不会出现无法恢复数据的严重问题。
GlusterFS由于其新颖的设计理念及遵循KISS (Keeplt as Stupid and Simple)原则的系统架构,在扩展性、可靠性、性能、维护性等方面具有独特的优势,发展迅速。2011年&#x