GFS分布式文件系统

目录

一、GlusterFS简介

二、GlusterFS特点

三、GlusterFS术语

四、模块化堆栈式架构

五、GlusterFS的工作流程

六、弹性HASH算法

七、GlusterFS的卷类型


1. GlusterFS简介

GlusterFS 是一个开源的分布式文件系统,设计目的是为数据存储提供高扩展性和高可靠性。它由存储服务器、客户端以及可选的NFS/Samba存储网关组成。与传统的分布式文件系统不同,GlusterFS没有元数据服务器,避免了单点故障的问题,并且提升了系统的性能和可靠性。

  • Scale-Out 存储解决方案:通过扩展存储节点,GlusterFS能够支持PB级别的存储容量和数千个客户端。
  • 网络支持:支持TCP/IP和InfiniBand RDMA网络,实现物理分散的存储资源的聚合。

2. GlusterFS特点

  • 扩展性和高性能

    • Scale-Out架构:通过增加存储节点提升存储容量和性能。
    • 弹性哈希:避免了对元数据服务器的依赖,实现了并行化数据访问,减少了单点故障和性能瓶颈。
  • 高可用性

    • 自动复制:通过镜像或多次复制确保数据可用性。
    • 自我修复:数据修复功能以增量方式在后台进行,几乎不产生性能负担。
    • 兼容主流文件系统:不依赖私有数据格式,支持EXT3、XFS等标准文件系统。
  • 全局统一命名空间:将所有节点的存储容量整合为一个虚拟存储池,统一管理数据。

  • 弹性卷管理:逻辑卷可以在线调整,支持实时性能调优和负载均衡。

  • 基于标准协议:支持NFS、CIFS、HTTP、FTP、SMB等协议,与POSIX标准兼容。

3. GlusterFS术语

  • Brick(存储块):物理存储的基本单元,存储在GlusterFS的服务器上。
  • Volume(逻辑卷):一组Brick的集合,用于逻辑数据存储。
  • FUSE:用户空间的文件系统接口,允许用户创建自定义文件系统。
  • VFS:内核空间提供的虚拟文件系统接口。
  • Glusterd:每个节点上运行的后台管理进程。

4. 模块化堆栈式架构

GlusterFS采用模块化、堆栈式架构,通过组合不同模块实现复杂功能:

  • Replicate 模块:实现RAID1。
  • Stripe 模块:实现RAID0。
  • 组合:实现RAID10、RAID01等高级功能。

5. GlusterFS的工作流程

  1. 客户端或应用程序通过GlusterFS挂载点访问数据。
  2. 内核通过VFS API处理请求。
  3. VFS将请求交给FUSE内核文件系统,FUSE通过/dev/fuse设备文件传递数据。
  4. GlusterFS client处理数据,并通过网络传输到远端的GlusterFS Server。
  5. 服务器将数据写入存储设备。

6. 弹性HASH算法

  • 弹性 HASH 算法:将数据均匀分布到各个Brick上,解决了对元数据服务器的依赖,避免了单点故障和性能瓶颈。
  • 优点:保证数据平均分布,提高可靠性和性能。

7. GlusterFS的卷类型

  • 分布式卷(Distribute volume)

    • 数据通过HASH算法分布到所有Brick,类似于RAID0,没有冗余性。
    • 示例:gluster volume create dis-volume server1:/dir1 server2:/dir2 server3:/dir3
  • 条带卷(Stripe volume)

    • 文件分成数据块轮询分布到多个Brick,类似于RAID0,支持大文件存储。
    • 示例:gluster volume create stripe-volume stripe 2 transport tcp server1:/dir1 server2:/dir2
  • 复制卷(Replica volume)

    • 文件同步到多个Brick上,具备冗余性,类似于RAID1。
    • 示例:gluster volume create rep-volume replica 2 transport tcp server1:/dir1 server2:/dir2
  • 分布式条带卷(Distribute Stripe volume)

    • 结合分布式卷和条带卷,适用于大文件处理。
    • 示例:gluster volume create dis-stripe stripe 2 transport tcp server1:/dir1 server2:/dir2 server3:/dir3 server4:/dir4
  • 分布式复制卷(Distribute Replica volume)

    • 结合分布式卷和复制卷,提供冗余和分布。
    • 示例:gluster volume create dis-rep replica 2 transport tcp server1:/dir1 server2:/dir2 server3:/dir3 server4:/dir4
  • 条带复制卷(Stripe Replica volume)

    • 结合条带卷和复制卷,类似于RAID10。
  • 分布式条带复制卷(Distribute Stripe Replica volume)

    • 结合所有基本卷类型,通常用于Map Reduce应用。

8、维护命令

1.查看GlusterFS卷
gluster volume list 

2.查看所有卷的信息
gluster volume info

3.查看所有卷的状态
gluster volume status

4.停止一个卷
gluster volume stop dis-stripe

5.删除一个卷,注意:删除卷时,需要先停止卷,且信任池中不能有主机处于宕机状态,否则删除不成功
gluster volume delete dis-stripe

6.设置卷的访问控制
#仅拒绝
gluster volume set dis-rep auth.deny 192.168.80.100

#仅允许
gluster volume set dis-rep auth.allow 192.168.80.*      #设置192.168.80.0网段的所有IP地址都能访问dis-rep卷(分布式复制卷)


 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值