GlusterFS是什么?
- Gluster是一个 开源的分布式文件系统。
- 是一个C/S架构。
- 由存储服务器、客户端以及NFS/Samba存储网关组成。
- 没有元数据服务器组件,这有助于提升整个系统的性能,可靠性和稳定性。
文件系统定义
- 负责实现数据存储方式,以什么格式保存在磁盘中的一个技术。
GlusterFS特点
扩展性和高性能
- 分布式的特性
高可用性
- 冗余、容灾的能力
全局统一命令空间
- 将所有节点的命名空间整个统一命令空间。将整个系统的所有节点的存储容量组成一个大的虚拟存储池,供客户端访问。
弹性卷管理
- 逻辑存储池可以在线进行增加和移除,不会导致业务中断。逻辑卷可以根据需求在线增长和缩减,并可以在多个节点中实现负载均衡。
基于标准协议
- 按照什么协议进行传输(TCP/UDP),Gluster 存储服务支持 NFS、CIFS、HTTP、FTP、SMB 及 Gluster原生协议,完全与 POSIX 标准(可移植操作系统接口)兼容。
GlusterFS专业术语
Brick(块存储服务器)
- 实际存储用户数据的服务器(相当于逻辑卷中的PE)
Volume(逻辑卷)
-
一个逻辑卷是一组Brick的集合,卷是数据存储的逻辑设备。
-
本地文件系统的“分区”
FUSE(用户空间的文件系统)
- 用户的空间的文件系统(类别EXT4),这是一个”伪文件系统(就是虚拟的文件系统)“,用户端的交换模块。
VFS(虚拟端口)
- 用户是提交请求给VFS,然后VFS交给FUSH,再交给GFS客户端,最后由客户端交给远程服务端进行存储。
Glusterd(服务)
- 是运行再存储节点的进程(客户端运行的是gluster client),GFS使用过程中整个GFS之间的交换由Gluster client 和 glusterd 完成。
模块化堆栈式架构
- GlusterFS 采用模块化、堆栈式的架构。
- 通过对模块进行各种组合,即可实现复杂的功能。例如 Replicate 模块可实现 RAID1,Stripe 模块可实现 RAID0, 通过两者的组合可实现 RAID10 和 RAID01,同时获得更高的性能及可靠性。
GlusterFS构成
模块化推栈式架构
- 模块化、推栈式的架构
- 通过对模块的组合,实现复杂的功能
1、API: 应用程序编程接口
2、模块化: 每个模块可以提供不同的功能
3、推栈式: 同时启用多个模块,多个功能功能可以组合,实现复杂的功能
GlusterFS总流程
I/O cache : I/O缓存
read ahead : 内核文件预读
distribute/stripe: 分布式、条带化
Gige: 千兆网/千兆接口
TCP/IP: 网络协议
InfiniBand: 网络协议,与TCP/IP具有转发丢失数据包的特性,基于此通信协议可能导致通信变慢,而IB使用基于信任的,流程制的机制来保证连接的完整性。
RDMA: 负责数据传输,有一种数据传输协议,功能:为了解决传输过程中客户端与服务器端数据处理的延迟。
上半部分为客户端,中间为网络层,下班部分为服务端
- 封装多核功能模块,组成推栈式的结构,来实现复杂的功能。
- 然后以请求的方式与客户端进行交互,客户端与服务端进行交互,由于可能会存在系统兼容问题,需要通过posix来解决系统兼容性问题,让客户端的命令通过posix过滤后可以在服务端执行。
GFS的工作原理
①外来一个请求,例:用户端申请创建一个文件,客户端或应用程序通过GFS的挂载点访问数据。
②linux系统内核通过VFS的API收到请求并处理。
③VFS将数据递交给FUSE内核文件系统,fuse文件系统则是将数据通过/dev/fuse设备文件递交给GluseterFS client端。
④GlusterFS client端收到数据后,会根据配置文件的配置对数据进行处理。
⑤再通过网络,将数据发送给远程端的Gluster server,并将数据写入到服务器储存设备上。
⑥server再将数据转交给VFS虚拟文件系统转换,再由VFS进行CFS转存处理,最后交给EXT3文件系统,最后存储到磁盘中。
分布式gfs服务器存储
分布式GFS存储是依靠于弹性hash算法,通过对存储内容进行hash算法的运算,可以得到32位的整数,将32位整数平均划分到 分布式服务器中,也就是每一个brick对应一段整数范围。用户根据计算得出数字找到对应的brick块。
弹性HASH算法
弹性 HASH 算法是 Davies-Meyer 算法的具体实现,通过 HASH 算法可以得到一个 32 位的整数范围的 hash 值,
假设逻辑卷中有 N 个存储单位 Brick,则 32 位的整数范围将被划分为 N 个连续的子空间,每个空间对应一个 Brick。
当用户或应用程序访问某一个命名空间时,通过对该命名空间计算 HASH 值,根据该 HASH 值所对应的 32 位整数空间定位数据所在的 Brick。
弹性HASH算法的优点
- 保证数据平均分布在每一个Brick中
- 解决了对元数据服务器的依赖,进而解决了单点故障
GlusterFS的卷类型
分布式卷
- 没有对文件进行分块处理
- 通过扩展文件属性保存HASH值
- 支持底层文件系统有EXT3、EXT4、ZFS、XFS等
特点:
- 文件分布在不同的服务器,不具备冗余性
- 更容易和廉价的扩展卷的大小。
- 单点故障会造成数据丢失
- 依赖底层的数据保护
条带卷
- 根据偏移量将文件分成N块(N个条带节点),轮询的存储在每个Brick Server节点
- 存储大文件时,性能尤为突出
- 不具备冗余性,类似Raid0
特点
- 数据被分割成更小块分布到块服务器群集中的不同条带区。
- 分布减少了负载且更小的文件加速了存取的速度。
- 没有数据冗余
复制卷
- 同一文件保存一份或多份副本
- 因为要保存副本,所以磁盘利用率较低
- 若多个节点上的存储空间不一致,将按照木桶效应取最低点的容量作为该卷的总容量
特点
- 卷中所有的服务器均保存一个完整的副本
- 卷的副本数量可由创建的时候决定,但是复制必须等于卷中Brick所包含的存储服务器数。
- 至少由两块服务器或更多服务器
- 具备冗余性
分布式条带卷
- 兼顾分布式卷和条带卷的功能
- 主要用于大文件访问处理
- 至少最少需要4台服务器
分布式复制卷
- 兼顾分布式卷和复制卷的功能
- 用于需要冗余的情况
部署GlusterFS集群实验
集群环境
客户端192.168.200.12
node1 :192.168.200.13
node2 :192.168.200.14
node3 :192.168.200.15
node4 :192.168.200.16
首先,每台节点添加四块磁盘,大小随意
Node1节点:node1/192.168.200.13 磁盘: /dev/sdb1 挂载点: /data/sdb1
/dev/sdc1 /data/sdc1
/dev/sdd1 /data/sdd1
/dev/sde1 /data/sde1
Node2节点:node2/192.168.200.14 磁盘: /dev/sdb1 挂载点: /data/sdb1
/dev/sdc1 /data/sdc1
/dev/sdd1 /data/sdd1
/dev/sde1 /data/sde1
Node3节点:node3/192.168.200.15 磁盘: /dev/sdb1 挂载点: /data/sdb1
/dev/sdc1 /data/sdc1
/dev/sdd1 /data/sdd1
/dev/sde1 /data/sde1
Node4节点:node4/192.168.200.16 磁盘: /dev/sdb1 挂载点: /data/sdb1
/dev/sdc1 /data/sdc1
/dev/sdd1 /data/sdd1
/dev/sde1 /data/sde1
=====客户端节点:192.168.200.12=====
关闭防火墙
每台机器均需要关闭
systemctl stop firewalld
setenforce 0
节点进行磁盘挂载,安装本地源
所有节点都需要做,这边以node1为例
------------------------编写自动分区脚本,并执行---------------------------
[root@zs ~] # vim /opt/fdisk.sh
#!/bin/bash
NEWDEV=`ls /dev/sd* | grep -o 'sd[b-z]' | uniq`
for VAR in $NEWDEV
do
echo -e "n\np\n\n\n\nw\n" | fdisk /dev/$VAR &> /dev/null
mkfs.xfs /dev/${VAR}"1" &> /dev/null
mkdir -p /data/${VAR}"1" &> /dev/null
echo "/dev/${VAR}"1" /data/${VAR}"1" xfs defaults 0 0" >> /etc/fstab
done
mount -a &> /dev/null
========》wq
[root@zs ~] # chmod +x /opt/fdisk.sh
[root@zs ~] # cd /opt/
[root@zs /opt] # ./fdisk.sh
-----------------------创建本地DNS-------------------------------
[root@zs /opt] # echo "192.168.200.13 node1" >> /etc/hosts
[root@zs /opt] # echo "192.168.200.14 node2" >> /etc/hosts
[root@zs /opt] # echo "192.168.200.15 node3" >> /etc/hosts
[root@zs /opt] # echo "192.168.200.16 node4" >> /etc/hosts
----------------------上传gfsrepo软件到/opt目录下
[root@zs /opt] # ls
fdisk.sh rh
[root@zs /opt] # rz -E
rz waiting to receive.
[root@zs /opt] # ls
fdisk.sh gfsrepo.zip rh
[root@zs /opt] # unzip gfsrepo.zip
----------------------编写创建本地源脚本,并执行------------------------
[root@zs opt]# vim /opt/gfs.sh
cd /etc/yum.repos.d/
mkdir repo.bak
mv *.repo repo.bak
echo '[glfs]
name=glfs
baseurl=file:///opt/gfsrepo
gpgcheck=0
enabled=1' > glfs.repo
[root@node1 opt]# chmod +x gfs.sh
yum clean all && yum makecache
--------------------安装glusterd服务,并启动---------------------
[root@zs opt]# yum -y install glusterfs glusterfs-server glusterfs-fuse glusterfs-rdma
[root@zs opt]# systemctl start glusterd.service
[root@zs opt]# systemctl enable glusterd.service
[root@zs opt]# systemctl status glusterd.service
未完待续~