分布式文件系统之GPFS

    GPFS是IBM公司通过完善和发展其Tiger Shark文件系统发展而来。GPFS通过共享磁盘结构来实现其强大的扩展性。一个GPFS系统由许多集群节点组成,GPFS文件系统和应用程序在上面运行。这些节点通过交互网络架构(Switch Fabric)网络连接磁盘。所有节点对所有磁盘拥有相同的访问权。文件被分割存储在文件系统中所有的磁盘上。这种条带化的存储不仅能够保证各个磁盘负载均衡,还能够使系统获得最高的吞吐量。

    GPFS文件系统架构图如下:

   

        将文件系统节点和共享磁盘连接起来的交互网络架构(Switch Fabric)可能包含SAN网络,例如FC和iSCSI。另外,个人本地磁盘也可以挂载到一些I/O节点,文件系统节点通过一个运行在通信网络上的软件层来对这些磁盘进行访问,例如IBM的VSD(virtual share disk),其运行在SP网络上,就是这样的一个软件层。

       来自多个节点的对磁盘进行的读和写需要进行同步,否则用户数据和元数据将会崩溃。GPFS采用分布式锁机制来同步对磁盘的访问。为了实现系统的高吞吐量,大文件需要进行分块,GPFS没有依赖额外逻辑卷管理层(logical volume manager (LVM) layer)来实现分块,而是自己实现了分块机制。通过实现分块机制,GPFS获得了对容错和负载均衡的控制。(一些LVM也有类似的功能,但是他们不可能获得网络的拓扑)。

    GPFS采用256KB(也可以是16KB-1MB)的大数据块作为磁盘块大小。当某个单线程的应用程序需要读一个文件时,GPFS采用prefetch机制预先将文件读到本地IO,后端采用并行IO的方式,最大限度的发挥带宽和磁盘的优势将文件提取到本地。同样,不再需要的脏数据缓存也采用并行IO的方式写到磁盘。GPFS能够识别顺序,反序等读写模式,对于不常见的读写模式,GPFS提供接口传递prefetch命令给文件系统。

    GPFS也是一种日志文件系统,为不同节点建立各自独立的日志。日志中记录MetaData的分布,一旦节点发生故障,可以保证快速恢复数据GPFS 通过一套复杂的信令管理机制提供数据一致性,通过这套机制允许任意节点通过各自独立的路径到达同一个文件。即使节点无法正常工作, GPFS 也可以找到其它的路径。GPFS在数据保护方面采用数据复制的方式进行,GPFS实现了一个较为简单的软件RAID模式,支持数据块级别的文件复制。


参考:

1.http://www.it165.net/admin/html/201307/1485.html

2.GPFS: A Shared-Disk File System for Large Computing Clusters

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: GPFS 文件系统商业版是一种高级文件系统软件,它是IBM公司的产品。它为企业和机构提供了高度可扩展、高性能、高可用性的存储解决方案,支持各种不同形式和规模的数据存储需求,包括数据分析、大规模文件共享、高性能计算等。 GPFS 文件系统商业版的主要特点如下: 1. 高可用性: GPFS可以在存储介质、节点、网络等各个层次提供容错机制,保证数据的安全性和连续性。 2. 高扩展性: GPFS可以支持从几个节点到上万个节点的扩展,由于其分布式架构,可以容易扩展处理能力、存储能力和吞吐量。 3. 高性能: GPFS 采用了并行 I/O、缓存区共享、快速恢复、数据分配优化等技术,能够以最大限度发挥硬件设备的性能。 4. 适合大数据: GPFS可以应对超大数据集,直接管理多 PB 级别数据,支持并发访问,快速存取。 GPFS 文件系统商业版具有许多重要的应用,包括科学研究、金融业、医疗保健、大规模互联网服务等领域。不管是在何种领域,相比于传统的文件系统GPFS 文件系统商业版都具有更出色的特性和能力,可以有效地解决多种数据存储的需求。 ### 回答2: GPFS是一种高性能并行文件系统,具有高度可扩展性和可靠性。它是IBM建造的。它被广泛用于大型数据中心,高性能计算和大数据分析场景,比如搜寻引擎、云存储、视频流处理等。 GPFS商业版提供完整的支持和保证,用户可以通过向供应商购买服务获得支持,包括技术支持和更新、咨询服务等。商业版提供高质量、可靠的服务和功能,比如完善的备份和恢复机制、数据管理和监控等。此外,GPFS商业版提供了更多的安全性和数据保护功能,用户可以选择不同的存储策略来满足自己的需求。 商业版GPFS也提供了更高的性能,比如更高的带宽、更快的数据读写、更低的延迟等。它还支持多个操作系统和硬件平台,包括Linux、UNIX和Windows等。它能够处理大量的并发读写请求,同时支持多个客户端,保证了系统的可用性和可靠性。 总之,商业版GPFS是一种高度可靠、可扩展和高性能的文件系统,适用于大量数据处理和运行强大的应用程序的场景。它提供更多的安全性和数据保护功能,并能够满足客户的各种需求。 ### 回答3: IBM的GPFS文件系统是一个高度可扩展的文件系统,可用于解决大型数据集管理问题。商业版提供了更加稳定、可靠的支持,同时也提供了更多的高级功能,如数据压缩、加密、数据分块、数据快照等。 GPFS文件系统的商业版还支持多种存储平台,包括IBM Spectrum Scale、IBM Elastic Storage Server、IBM Storage Systems等,这使得GPFS文件系统的商业版能够更加灵活、适应不同的企业需求。 与开源的文件系统相比,GPFS文件系统的商业版也提供了更加优秀的数据完整性保护和数据安全性保障。商业版的GPFS文件系统还具有更加友好的用户界面和更加详细的文档说明,用户能够更加快速、准确地了解和使用文件系统。 总的来说,GPFS文件系统商业版是一款功能全面、性能卓越、可靠稳定、丰富灵活的文件系统,能够满足企业在数据处理方面的需求,并提供强大的数据保护和安全控制。它也是数据管理领域中的重要工具之一,为数据管理和分析领域的专业人士提供了强有力的支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值