GFS分布式文件系统

最新推荐文章于 2024-06-12 10:58:42 发布

辛辣天蝎666

最新推荐文章于 2024-06-12 10:58:42 发布

阅读量652

点赞数 1

分类专栏：数据库数据存储运维 GlusterFS分布式文件系统文章标签：服务器网络运维

本文链接：https://blog.csdn.net/weixin_71429850/article/details/127234875

版权

运维同时被 3 个专栏收录

32 篇文章 3 订阅

订阅专栏

数据库数据存储

4 篇文章 0 订阅

订阅专栏

GlusterFS分布式文件系统

1 篇文章 0 订阅

订阅专栏

一、GlusterFS简介

1、GlusterFS是什么？

Gluster是一个 开源的分布式文件系统。
是一个C/S架构。
- 由存储服务器、客户端以及NFS/Samba存储网关组成。
没有元数据服务器组件，这有助于提升整个系统的性能，可靠性和稳定性。

文件系统定义

负责实现数据存储方式，以什么格式保存在磁盘中的一个技术。

2、GlusterFS特点

扩展性和高性能

分布式的特性

高可用性

冗余、容灾的能力

全局统一命令空间

将所有节点的命名空间整个统一命令空间。将整个系统的所有节点的存储容量组成一个大的虚拟存储池，供客户端访问。

弹性卷管理

逻辑存储池可以在线进行增加和移除，不会导致业务中断。逻辑卷可以根据需求在线增长和缩减，并可以在多个节点中实现负载均衡。

基于标准协议

按照什么协议进行传输（TCP/UDP），Gluster 存储服务支持 NFS、CIFS、HTTP、FTP、SMB 及 Gluster原生协议，完全与 POSIX 标准（可移植操作系统接口）兼容。

二、GlusterFS专业术语

1、Brick（块存储服务器）

实际存储用户数据的服务器（相当于逻辑卷中的PE）

2、Volume（逻辑卷）

一个逻辑卷是一组Brick的集合，卷是数据存储的逻辑设备。
本地文件系统的“分区”

3、FUSE（用户空间的文件系统）

用户的空间的文件系统（类别EXT4），这是一个”伪文件系统（就是虚拟的文件系统）“，用户端的交换模块。

4、VFS（虚拟端口）

用户是提交请求给VFS，然后VFS交给FUSH，再交给GFS客户端，最后由客户端交给远程服务端进行存储。

5、Glusterd（服务）

是运行再存储节点的进程（客户端运行的是gluster client），GFS使用过程中整个GFS之间的交换由Gluster client 和 glusterd 完成。

4．模块化堆栈式架构

GlusterFS 采用模块化、堆栈式的架构。
通过对模块进行各种组合，即可实现复杂的功能。例如 Replicate 模块可实现 RAID1，Stripe 模块可实现 RAID0，通过两者的组合可实现 RAID10 和 RAID01，同时获得更高的性能及可靠性。

总结：以上虚拟文件系统

三、GlusterFS构成

模块化推栈式架构

模块化、推栈式的架构
通过对模块的组合，实现复杂的功能

1、API： 应用程序编程接口

2、模块化： 每个模块可以提供不同的功能

3、推栈式： 同时启用多个模块，多个功能功能可以组合，实现复杂的功能

1、GlusterFS总流程

I/O cache ： I/O缓存
read ahead ： 内核文件预读
distribute/stripe： 分布式、条带化
Gige： 千兆网/千兆接口
TCP/IP： 网络协议
InfiniBand： 网络协议，与TCP/IP具有转发丢失数据包的特性，基于此通信协议可能导致通信变慢，而IB使用基于信任的，流程制的机制来保证连接的完整性。
RDMA： 负责数据传输，有一种数据传输协议，功能：为了解决传输过程中客户端与服务器端数据处理的延迟。

上半部分为客户端，中间为网络层，下班部分为服务端

封装多核功能模块，组成推栈式的结构，来实现复杂的功能。
然后以请求的方式与客户端进行交互，客户端与服务端进行交互，由于可能会存在系统兼容问题，需要通过posix来解决系统兼容性问题，让客户端的命令通过posix过滤后可以在服务端执行。

2、GFS的工作原理

上图说明

①外来一个请求，例：用户端申请创建一个文件，客户端或应用程序通过GFS的挂载点访问数据。

②linux系统内核通过VFS的API收到请求并处理。

③VFS将数据递交给FUSE内核文件系统，fuse文件系统则是将数据通过/dev/fuse设备文件递交给GluseterFS client端。

④GlusterFS client端收到数据后，会根据配置文件的配置对数据进行处理。

⑤再通过网络，将数据发送给远程端的Gluster server，并将数据写入到服务器储存设备上。

⑥server再将数据转交给VFS虚拟文件系统转换，再由VFS进行CFS转存处理，最后交给EXT3文件系统，最后存储到磁盘中。

3、分布式gfs服务器存储

分布式GFS存储是依靠于弹性hash算法，通过对存储内容进行hash算法的运算，可以得到32位的整数，将32位整数平均划分到分布式服务器中，也就是每一个brick对应一段整数范围。用户根据计算得出数字找到对应的brick块。

弹性HASH算法

弹性 HASH 算法是 Davies-Meyer 算法的具体实现，通过 HASH 算法可以得到一个 32 位的整数范围的 hash 值，
假设逻辑卷中有 N 个存储单位 Brick，则 32 位的整数范围将被划分为 N 个连续的子空间，每个空间对应一个 Brick。
当用户或应用程序访问某一个命名空间时，通过对该命名空间计算 HASH 值，根据该 HASH 值所对应的 32 位整数空间定位数据所在的 Brick。

弹性HASH算法的优点

保证数据平均分布在每一个Brick中
解决了对元数据服务器的依赖,进而解决了单点故障

四、GlusterFS的卷类型

1、分布式卷

没有对文件进行分块处理
通过扩展文件属性保存HASH值
支持底层文件系统有EXT3、EXT4、ZFS、XFS等

特点：

文件分布在不同的服务器，不具备冗余性
更容易和廉价的扩展卷的大小。
单点故障会造成数据丢失
依赖底层的数据保护

2、条带卷

根据偏移量将文件分成N块（N个条带节点），轮询的存储在每个Brick Server节点
存储大文件时，性能尤为突出
不具备冗余性，类似Raid0

特点

数据被分割成更小块分布到块服务器群集中的不同条带区。
分布减少了负载且更小的文件加速了存取的速度。
没有数据冗余

3、复制卷

同一文件保存一份或多份副本
因为要保存副本，所以磁盘利用率较低
若多个节点上的存储空间不一致，将按照木桶效应取最低点的容量作为该卷的总容量。

特点

卷中所有的服务器均保存一个完整的副本
卷的副本数量可由创建的时候决定，但是复制必须等于卷中Brick所包含的存储服务器数。
至少由两块服务器或更多服务器
具备冗余性

4、分布式条带卷

兼顾分布式卷和条带卷的功能
主要用于大文件访问处理
至少最少需要4台服务器

5、分布式复制卷

兼顾分布式卷和复制卷的功能
用于需要冗余的情况

五、部署GlusterFS集群实验

1、集群环境

Node1节点：node1/192.168.100.3 磁盘： /dev/sdb1           挂载点： /data/sdb1
                               /dev/sdc1                   /data/sdc1
                               /dev/sdd1                   /data/sdd1
                               /dev/sde1                   /data/sde1

Node2节点：node2/192.168.100.20 磁盘： /dev/sdb1           挂载点： /data/sdb1
                               /dev/sdc1                   /data/sdc1
                               /dev/sdd1                   /data/sdd1
                               /dev/sde1                   /data/sde1

Node3节点：node3/192.168.100.50 磁盘： /dev/sdb1           挂载点： /data/sdb1
                               /dev/sdc1                   /data/sdc1
                               /dev/sdd1                   /data/sdd1
                               /dev/sde1                   /data/sde1

Node4节点：node4/192.168.100.90 磁盘： /dev/sdb1       挂载点： /data/sdb1
                               /dev/sdc1               /data/sdc1
                               /dev/sdd1               /data/sdd1
                               /dev/sde1               /data/sde1

=====客户端节点：192.068.100.2=====

2、更改节点名称和关闭防火墙

四台机子都姚更改

3、节点进行磁盘挂载，安装本地源

所有节点都需要做，这边以node1为例

进行时间同步

添加节点创建集群

添加节点到存储信任池中（仅需在一个节点上操作，我这里依旧在node1节点上操作）
gluster peer probe node1
gluster peer probe node2
gluster peer probe node3
gluster peer probe node4
gluster peer status

根据规划创建卷

卷名	卷类型	Brick
dis-volume	分布式卷	node1(/data/sdb1)、node2(/data/sdb1)
stripe-volume	条带卷	node1(/data/sdc1)、node2(/data/sdc1)
rep-volume	复制卷	node3(/data/sdb1)、node4(/data/sdb1)
dis-stripe	分布式条带卷	node1(/data/sdd1)、node2(/data/sdd1)、node3(/data/sdd1)、node4(/data/sdd1)
dis-rep	分布式复制卷	node1(/data/sde1)、node2(/data/sde1)、node3(/data/sde1)、node4(/data/sde1)

创建分布式卷

gluster volume create dis-volume node1:/data/sdb1 node2:/data/sdb1 force

创建分布式卷，没有指定类型，默认创建的是分布式卷
gluster volume list
#查看类型
gluster volume start dis-volume
#开启
gluster volume info dis-volume
#查看卷信息

创建条带卷

指定类型为 stripe，数值为 2，且后面跟了 2 个 Brick Server，所以创建的是条带卷
gluster volume create stripe-volume stripe 2 node1:/data/sdc1 node2:/data/sdc1 force
gluster volume start stripe-volume
gluster volume info stripe-volume

创建复制卷

指定类型为 replica，数值为 2，且后面跟了 2 个 Brick Server，所以创建的是复制卷

gluster volume create rep-volume replica 2 node3:/data/sdb1 node4:/data/sdb1 force
gluster volume start rep-volume
gluster volume info rep-volume

创建分布式条带卷

gluster volume create dis-stripe stripe 2 node1:/data/sdd1 node2:/data/sdd1 node3:/data/sdd1 node4:/data/sdd1 force
gluster volume start dis-stripe
gluster volume info dis-stripe

创建分布式复制卷

指定类型为 replica，数值为 2，而且后面跟了 4 个 Brick Server，是 2 的两倍，所以创建的是分布式复制卷
gluster volume create dis-rep replica 2 node1:/data/sde1 node2:/data/sde1 node3:/data/sde1 node4:/data/sde1 force
gluster volume start dis-rep
gluster volume info dis-rep

gluster volume list

部署gluster客户端

部署Gluster客户端（192.168.32.11）
systemctl stop firewalld
setenforce 0
cd /opt
unzip gfsrepo.zip

cd /etc/yum.repos.d/
mv .repo repos.bak
vim glfs.repo
[glfs]
name=glfs
baseurl=file:///opt/gfsrepo
gpgcheck=0
enabled=1

yum -y install glusterfs glusterfs-fuse
mkdir -p /test/{dis,stripe,rep,dis_stripe,dis_rep}
cd /test/

echo "192.168.100.20 node1" >> /etc/hosts
echo "192.168.100.50 node2" >> /etc/hosts
echo "192.168.100.60 node3" >> /etc/hosts
echo "192.168.100.3 node4" >> /etc/hosts

mount.glusterfs node1:dis-volume /test/dis
mount.glusterfs node1:stripe-volume /test/stripe
mount.glusterfs node1:rep-volume /test/rep
mount.glusterfs node1:dis-stripe /test/dis_stripe
mount.glusterfs node1:dis-rep /test/dis_rep

测试文件系统

写入文件

dd if=/dev/zero of=/opt/demo1.log bs=1M count=20
dd if=/dev/zero of=/opt/demo2.log bs=1M count=20
dd if=/dev/zero of=/opt/demo3.log bs=1M count=20
dd if=/dev/zero of=/opt/demo4.log bs=1M count=20
dd if=/dev/zero of=/opt/demo5.log bs=1M count=20

ls -lh /opt

cp demo* /test/dis
cp demo* /test/stripe/
cp demo* /test/rep/
cp demo* /test/dis_stripe/
cp demo* /test/dis_rep/

查看文件分布

查看分布式文件分布（node1:/dev/sdb1、node2:/dev/sdb1）

[root@node1 ~]# ls -lh /data/sdb1
[root@node2 ~]# ls -lh /data/sdb1

查看条带卷文件分布（node1:/dev/sdc1、node2:/dev/sdc1）

[root@node1 ~]#ls -lh /data/sdc1
[root@node2 ~]#ls -lh /data/sdc1

查看复制卷文件分布（node3:/dev/sdb1、node4:/dev/sdb1）

[root@node3 ~]#ll -h /data/sdb1
[root@node4 ~]#ll -h /data/sdb1

查看分布式条带卷分布（node1:/dev/sdd1、node2:/dev/sdd1、node3:/dev/sdd1、node4:/dev/sdd1）

[root@node1 ~]#ll -h /data/sdd1
[root@node2 ~]#ll -h /data/sdd1
[root@node3 ~]#ll -h /data/sdd1
[root@node4 ~]#ll -h /data/sdd1

查看分布式复制卷分布（node1:/dev/sde1、node2:/dev/sde1、node3:/dev/sde1、node4:/dev/sde1）

[root@node1 ~]#ll -h /data/sde1
[root@node2 ~]#ll -h /data/sde1
[root@node3 ~]#ll -h /data/sde1
[root@node4 ~]#ll -h /data/sde1

破坏性测试/冗余测试

挂起node2节点模拟故障

在客户端

分布式数据查看，缺少demo5这是在node2上的，不具备冗余

ll /test/dis

条带卷，无法访问，不具备冗余

ll /test/stripe/

复制卷，在node3和node4上的，关闭node4进行测试，具有冗余

ll /test/rep/ #会卡一段时间，耐心等待

分布式条带卷，不具备冗余

ll /test/dis_stripe/

分布式复制卷，具有冗余

ll /test/dis_rep/

其他维护命令

1．查看GlusterFS卷
gluster volume list

2．查看所有卷的信息
gluster volume info

3．查看所有卷的状态
gluster volume status

4．停止一个卷
gluster volume stop dis-stripe

5．删除一个卷，注意：删除卷时，需要先停止卷，且信任池中不能有主机处于宕机状态，否则删除不成功
gluster volume delete dis-stripe

6．设置卷的访问控制
#仅拒绝
gluster volume set dis-rep auth.allow 192.168.32.11

#仅允许
gluster volume set dis-rep auth.allow 192.168.32.* #设置192.168.184.0网段的所有IP地址都能访问dis-rep卷（分布式复制卷）

辛辣天蝎666

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
GFS分布式文件系统

查看分布式条带卷分布（node1:/dev/sdd1、node2:/dev/sdd1、node3:/dev/sdd1、node4:/dev/sdd1）查看分布式复制卷分布（node1:/dev/sde1、node2:/dev/sde1、node3:/dev/sde1、node4:/dev/sde1）Node1节点：node1/192.168.100.3 磁盘： /dev/sdb1 挂载点： /data/sdb1。一个逻辑卷是一组Brick的集合，卷是数据存储的逻辑设备。
复制链接

扫一扫

专栏目录