GFS分布式文件系统

本文详细介绍了GoogleFileSystem(GFS)的概述、特点,包括其分布式存储、高可用性、命名空间管理和各种卷类型(如分布式、条带、复制和分布式条带卷)。重点讲解了工作流程和术语,如brick和volume的概念。
摘要由CSDN通过智能技术生成

1.gfs简介

开源的分布式文件系统

由存储服务器、客户端以及NFS/Samba存储网关组成

无元数据服务器

存储

块存储

文件存储 nfs lvm raid

对象存储 GFS ceph fastdfs oss s3

挂载文件系统如何存放

在这里插入图片描述

2.gfs特点

扩展性和高性能(分布式)

高可用性(冗余、容灾能力)

全局统一命名空间(独立的一个空间)

分布式存储中,将所有节点的命名空间整合为统一命名空间,将整个系统的所有节点的存储容量组成一个大的虚拟存储池,供前端主机访问这些节点完成数据读写操作。

弹性卷管理

GlusterFs通过将数据储存在逻辑卷中,逻辑卷从逻辑存储池进行独立逻辑划分而得到。逻辑存储池可以在线进行增加和移除,不会导致业务中断。逻辑卷可以根据需求在线增长和缩减,并可以在多个节点中实现负载均衡。文件系统配置也可以实时在线进行更改并应用,从而可以适应工作负载条件变化或在线性能调优。

基于标准协议

存储服务支持NFS、CIFS、HTTP、FTP、SMB及Gluster原生协议,完全与posix标准(可移植操作系统接口)兼容。

现有应用程序不需要做任何修改就可以对Gluster中的数据进行访问,也可以使用专用API进行访问。

3.gfs术语

brick(存储块)

指可信主机池中由主机提供的用于物理存储的专用分区,是GlusterFS中的基本存储单元,同时也是可信存储池中服务器上对外提供的存储目录。

存储目录的格式由服务器和目录的绝对路径构成,表示方法为 SERVER:EXPORT,如192.168.80.10 : /data/ mydir / 。

volume(逻辑卷)

一个逻辑卷是一组 Brick 的集合。卷是数据存储的逻辑设备,类似于LVM中的逻辑卷。大部分Gluster管理操作是在卷上进行的。
在这里插入图片描述

fuse

是一个内核模块,允许用户创建自己的文件系统,无须修改内核代码。

伪文件系统

vfs

内核空间对用户空间提供的访问磁盘的接口。 虚拟端口

glusterd(服务端)

在存储集群中的每个节点上都要运行。

4.gfs工作流程(重点)

在这里插入图片描述

首先客户端通过gfs挂载点访问数据;

访问vfs(虚拟接口/api),通过fuse(内核)伪系统,

把数据保存在/dev/fuse(即内存中,是虚拟设备)

poll把数据指向客户端,让客户端来处理(根据配置文件)

客户端把数据交给服务端(远端控制)

服务端把数据放在vfs接口上

然后存储在ext3

读取速度快慢取决于内存中有没有

中间数据还是保存在内存当中

弹性hash算法

通过hash算法得到一个32位的整数

划分为n个连续的子空间,每个空间对应一个brick

弹性hash算法优点

保证数据平均分布在每一个brick中

解决了对元数据服务器的依赖,进而解决了单点故障以及访问瓶颈

5.gfs卷类型

分布式卷

没有对文件进行分块处理

通过扩展文件属性保存hash值

支持的底层文件系统有ext3、ext4、zfs、xfs

分布式卷特点

文件分布在不同服务器,不具备冗余性

更容易和廉价地扩展卷的大小

单点故障会造成数据丢失

依赖底层的数据保护

条带卷(数据不完整,会报错)

根据偏移量将文件分成n块(n个条带节点),轮询存储在每个brick server节点

存储大文件时,性能尤为突出

不具备冗余性,类似raid0

特点

数据被分割成更小块分布到块服务器群中的不同条带区

分布减少了负载且更小的文件加速了存取的速度

没有数据冗余

创建了一个名为Stripe-volume的条带卷,文件将被分块轮询的存储在Server1:/dir1和Server2:/dir2两个Brick中

#gluster volume create stripe-volume stripe 2 transport tcp server1:/dir1 server2:/dir2

复制卷

同一文件保存一份或多份副本

因为要保存副本,所以磁盘利用率较低

若多个节点上的存储空间不一致,将按照木桶效应取最低节点的容量作为该卷的总容量

特点

卷中所有服务器军保存一个完整的副本

卷的副本数量可由客户创建的时候决定

至少有两个块服务器或更多服务器

具备冗余性

创建复制卷
创建名为rep-volume的复制卷,文件将同时存储两个副本,分别在server1:/dir1和server2:/dir2两个Brick中

#gluster volume create rep-volume replica 2 transport tcp server1:/dir1 server2:/dir2

分布式条带卷

兼顾分布式卷和条带卷的功能

主要用于大文件访问处理

至少最少需要4台服务器

在这里插入图片描述

分布式复制卷

兼顾分布式和复制卷功能

用于需要冗余的情况

总结

分布式卷 条带卷 复制卷 分布式条带卷

分布式复制卷、条带复制卷和分布式条带复制卷

分布式卷 以文件为单位通过hash散列在一个个brick中,不具备冗余能力
条带卷 把文件数据进行分块,轮询的分布在各个brick中,不具备冗余能力
复制卷 把文集各个brick中的镜像存储,具备冗余能力

分布式条带卷 不具备冗余能力,至少要4个brick,brick数量>=条带数的两倍

分布式复制卷 具备冗余能力,至少要4个brick,brick数量>=副本数的两倍

条带卷 复制卷 分布式条带卷

分布式复制卷、条带复制卷和分布式条带复制卷

[外链图片转存中…(img-ci5vwDET-1690877318179)]

分布式条带卷 不具备冗余能力,至少要4个brick,brick数量>=条带数的两倍

分布式复制卷 具备冗余能力,至少要4个brick,brick数量>=副本数的两倍

weixin063传染病防控宣传微信小程序系统的设计与实现+springboot后端毕业源码案例设计 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值