架构解密从分布式到微服务:高性能计算领域的分布式文件系统

本文介绍了高性能计算领域的分布式文件系统,如IBM的GPFS和开源的Lustre。Lustre以其高扩展性和700GB/s的IO聚合带宽成为HPC首选,通过元数据服务器和对象存储服务器实现高效文件读写,常用于大规模高性能计算集群。然而,Lustre在小文件IO性能和硬件要求上存在一定局限性。
摘要由CSDN通过智能技术生成

高性能计算领域的分布式文件系统

NFS作为最早出现的分布式文件系统,其定位和目标主要还是小型网络文件系统。随着高性能计算(HPC)集群规模的不断加大,NFS这种简单的分布式文件系统已经无法满足要求,于是市场上出现了多种新的大型分布式文件系统,经典的如Google的Global File System (GFS)和IBM的General Parallel File System ( GPFS)。这些分布式文件系统管理的系统更复杂,规模更大,性能追求更高,比如直接对物理设备(块存储)访问而不是基于现有的文件系统。此外,磁盘布局和检索效率的优化、元数据的集中管理、缓存管理技术、文件级的负载平衡等都反映了人们对性能和容量的追求。下面以IBM的 GPFS为例,说明这种新的大型分布式文件系统的设计及架构特点。

如下图所示,GPFS并没有利用已有的文件系统,而是直接操作SAN存储网络提供的高性能块存储设备,所有客户机节点对所有磁盘都拥有相同的访问权。在 GPFS 中,一个文件被分割成几个部分并且存储在后端的多个磁盘上,这种条带化的存储不仅能够保证各个磁盘负载均衡,还能够使系统获得更高的I/O吞吐量。当某个单线程的应用程序需要读一个文件时,GPFS采用预读机制预先将文件读到本地IO 上,后端则采用并行IO 的方式同时操作多个磁盘块,最大限度地发挥带宽和磁盘的优势。

架构解密从分布式到微服务:高性能计算领域的分布式文件系统

 

GPFS这种基于SAN专有存储系统的大型分布式文件系统有两个明显的短板:首先,SAN存储系统硬件本身很昂贵,大部分人用不起;其次,SAN存储网络的扩展性并不好&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值