目录
1、查看分布式文件分布(node1:/dev/sdb1、node2:/dev/sdb1)
2、查看条带卷文件分布(node1:/dev/sdc1、node2:/dev/sdc1)
3、查看复制卷文件分布(node3:/dev/sdb1、node4:/dev/sdb1)
4、查看分布式条带卷分布(node1:/dev/sdd1、node2:/dev/sdd1、node3:/dev/sdd1、node4:/dev/sdd1)
5、查看分布式复制卷分布(node1:/dev/sde1、node2:/dev/sde1、node3:/dev/sde1、node4:/dev/sde1)
一,ClusterFS概述
ClusterFS:分布式文件系统
FS:文件系统组成
文件系统组成:
1,文件系统接口
2,对对象管理的软件集合
3,对象及属性
ClusterFS文件系统作用
文件系统作用:从系统角度来看,文件系统是对文件存储设备的空间进行组织和分配,负责文件存储并对存入的文件进行保护和索引的系统。
具体来说:它负责为用户建立文件,存入,读出,修改,存储文件,控制文件的存储。
文件系统的挂载使用:
除根文件系统以外的文件系统文件后要使用需要线挂载至挂载点才可以被访问,挂载点即分区设备文件关联的某个目录文件比如:NFS
二,分布式文件系统
GFS是由三部分组成(组件)
1存储服务器
2客户端
3NFS/Samba存储网关组成
比如说cd这个命令,执行过程中默认调用内核中函数,切换路径的功能,相当于系统调用。
GLusetrFS特点
扩展性和高性能
高可用性
全局统一命名空间
弹性卷管理
基于标准协议
GlusterFS术语
Brick:快服务器,使用固态盘存储数据类型
Volume:卷组,组合形式的存储
FUSE:伪文件系统(虚拟出来的文件系统)
VFS:伪文件系统(虚拟出来的文件系统)
PS:虚拟化:软件的技术来去模拟硬件的功能
Glusterd:GFS的一个server端(守护进程)
模块化的堆栈式的架构
模块化,堆栈式的架构(比如1-10有很多种组合方式最终展示的形式也是不一样的)
通过对模块的组合,实现复杂的功能。
三,GFS工作原理
解释的是如何通过存储在客户端上的数据,最终存储在GFS后端的卷里。
客户端通过挂载的方式访问文件系统,通过所谓的系统调用方式,和内核中的文件系统进行交互,正常存储数据的时候,正常和exit4对接就行,可以存储在本地。交给另一个文件系统接管,为了不给系统造成太大的压力,(只要提供一个可被调用的接口,所以交给VFS伪文件系统)通过FUSE伪文件系统转存(保存在一个虚拟的路径,映射的位置是/dev/fuse,这个数据和GFS的client端进行交互),伪文件系统的这个数据是存在内存中的,client端会监听数据,当更新时候,交给server端,这个时候要经过一个网络的转发(可以使用TCP/IP或者使用IB),网关是NFS。传到server端后,转存到本地的vfs伪文件系统中,再转存到本地。
四,GFS支持的其中卷
1分布式卷(默认):文件通过哈希算法分不到所有Brick Server 上,这种卷是GFS的基础。
2、条带卷(默认):类似RAID0,文件被分成数据块并以轮询的方式分布到多个Brick Server上,这种卷是Glusterf的基础,以文件为单位根据算法散列到不同的Brick,其实,只是扩大了磁盘的空间,如果有一块磁盘损坏,数据将被丢失,数据文件及的RAID0
3、复制卷(Replica volume):将文件同步到多个Brick上,使其具备多个文件副本,属于文件级RAID 1,具有容错能力。
4、分布式条带卷(Distribute Stripe volume):Brick Server数量是条带数(数据块分布的Brick数量)的倍数,兼具分布式卷和条带的特点。
5、分布式复制卷(Distribute Replica volume):Brick Server数量是镜像数(数据副本数量)的倍数,兼具分布式卷和复制卷的特点。
6、条带复制卷(Stripe Replca volume):类似RAID10,同时具有条带卷和复制卷的特点。
7、分布式条带复制卷(Distribute Stripe Replicavolume):三种基本卷的复合卷通常用于类Map Reduce应用
五,实际操作
Node1节点:node1/192.168.189.101 磁盘: /dev/sdb1 挂载点: /data/sdb1
/dev/sdc1 /data/sdc1
/dev/sdd1 /data/sdd1
/dev/sde1 /data/sde1
Node2节点:node2/192.168.189.102 磁盘: /dev/sdb1 挂载点: /data/sdb1
/dev/sdc1 /data/sdc1
/dev/sdd1 /data/sdd1
/dev/sde1 /data/sde1
Node3节点:node3/192.168.189.103 磁盘: /dev/sdb1 挂载点: /data/sdb1
/dev/sdc1 /data/sdc1
/dev/sdd1 /data/sdd1
/dev/sde1 /data/sde1
Node4节点:node4/192.168.189.120 磁盘: /dev/sdb1 挂载点: /data/sdb1
/dev/sdc1 /data/sdc1
/dev/sdd1 /data/sdd1
/dev/sde1 /data/sde1
=====客户端节点:192.168.189.100=====
1、首先,每台节点添加四块磁盘,仅做实验,无需太大
2、然后,重启服务器,准备开始部署
2、更改节点名称
node1(192.168.18.101)
[root@localhost ~]# hostname node1
[root@localhost ~]# su -
上一次登录:四 12月 30 10:20:12 CST 2021从 192.168.189.1pts/0 上
[root@node1 ~]# su -
node2(192.168.18.102)
[root@localhost ~]# hostname indo2
[root@localhost ~]# su
[root@indo2 ~]#
node(192.168.184.103)
[root@node4 ~]# hostname node3
[root@node4 ~]# su
[root@node3 ~]#
node(192.168.184.104)
[root@node4 ~]# hostname node5
[root@node4 ~]# su
[root@node5 ~]#
3、节点进行磁盘挂载,安装本地源
所有节点(这里使用node1作为示范)
[root@node1 ~] # systemctl stop firewalld
[root@node1 ~] # setenforce 0
[root@node1 ~] # vim /opt/fdisk.sh
#!/bin/bash
NEWDEV=`ls /dev/sd* | grep -o 'sd[b-z]' | uniq`
for VAR in $NEWDEV
do
echo -e "n\np\n\n\n\nw\n" | fdisk /dev/$VAR &> /dev/null
mkfs.xfs /dev/${VAR}"1" &> /dev/null
mkdir -p /data/${VAR}"1" &> /dev/null
echo "/dev/${VAR}"1" /data/${VAR}"1" xfs defaults 0 0" >> /etc/fstab
done
mount -a &> /dev/null
========》wq
[root@node1 ~] # chmod +x /opt/fdisk.sh
[root@node1 ~] # cd /opt/
[root@node1 /opt] # ./fdisk.sh
[root@node1 /opt] # echo "192.168.184.10 node1" >> /etc/hosts
[root@node1 /opt] # echo "192.168.184.20 node2" >> /etc/hosts
[root@node1 /opt] # echo "192.168.184.30 node3" >> /etc/hosts
[root@node1 /opt] # echo "192.168.184.40 node4" >> /etc/hosts
[root@node1 /opt] # ls
fdisk.sh rh
[root@node1 /opt] # rz -E
rz waiting to receive.
[root@node1 /opt] # ls
fdisk.sh gfsrepo.zip rh
[root@node1 /opt] # unzip gfsrepo.zip
[root@node1 /opt] # cd /etc/yum.repos.d/
[root@node1 /etc/yum.repos.d] # ls
local.repo repos.bak
[root@node1 /etc/yum.repos.d] # mv * repos.bak/
mv: 无法将目录"repos.bak" 移动至自身的子目录"repos.bak/repos.bak" 下
[root@node1 /etc/yum.repos.d] # ls
repos.bak
[root@node1 /etc/yum.repos.d] # vim glfs.repo
[glfs]
name=glfs
baseurl=file:///opt/gfsrepo
gpgcheck=0
enabled=1
========》wq
[root@node1 /etc/yum.repos.d] # yum clean all && yum makecache
已加载插件:fastestmirror, langpacks
正在清理软件源: glfs
Cleaning up everything
Maybe you want: rm -rf /var/cache/yum, to also free up space taken by orphaned data from disabled or removed repos
已加载插件:fastestmirror, langpacks
glfs | 2.9 kB 00:00:00
(1/3): glfs/filelists_db | 62 kB 00:00:00
(2/3): glfs/other_db | 46 kB 00:00:00
(3/3): glfs/primary_db | 92 kB 00:00:00
Determining fastest mirrors
元数据缓存已建立
[root@node1 /etc/yum.repos.d] # yum -y install glusterfs glusterfs-server glusterfs-fuse glusterfs-rdma
[root@node1 /etc/yum.repos.d] # systemctl start glusterd.service
[root@node1 /etc/yum.repos.d] # systemctl enable glusterd.service
Created symlink from /etc/systemd/system/multi-user.target.wants/glusterd.service to /usr/lib/systemd/system/glusterd.service.
[root@node1 /etc/yum.repos.d] # systemctl status glusterd.service
● glusterd.service - GlusterFS, a clustered file-system server
Loaded: loaded (/usr/lib/systemd/system/glusterd.service; enabled; vendor preset: disabled)
Active: active (running) since 二 2021-03-02 19:45:10 CST; 764ms ago
Main PID: 51664 (glusterd)
CGroup: /system.slice/glusterd.service
└─51664 /usr/sbin/glusterd -p /var/run/glusterd.pid --log-level INFO
12月 30 19:45:10 node1 systemd[1]: Starting GlusterFS, a clustered file-system server...
12月 30 19:45:10 node1 systemd[1]: Started GlusterFS, a clustered file-system server.
4、添加节点创建集群
添加节点到存储信任池中(仅需在一个节点上操作,我这里依旧在node1节点上操作)
[root@node1 ~] # gluster peer probe node1
peer probe: success. Probe on localhost not needed
[root@node1 ~] # gluster peer probe node2
peer probe: success.
[root@node1 ~] # gluster peer probe node3
peer probe: success.
[root@node1 ~] # gluster peer probe node4
peer probe: success.
[root@node1 ~] # gluster peer status
Number of Peers: 3
Hostname: node2
Uuid: 2ee63a35-6e83-4a35-8f54-c9c0137bc345
State: Peer in Cluster (Connected)
Hostname: node3
Uuid: e63256a9-6700-466f-9279-3e3efa3617ec
State: Peer in Cluster (Connected)
Hostname: node4
Uuid: 9931effa-92a6-40c7-ad54-7361549dd96d
State: Peer in Cluster (Connected)
5、根据规划创建卷
========根据以下规划创建卷=========
卷名称 卷类型 Brick
dis-volume 分布式卷 node1(/data/sdb1)、node2(/data/sdb1)
stripe-volume 条带卷 node1(/data/sdc1)、node2(/data/sdc1)
rep-volume 复制卷 node3(/data/sdb1)、node4(/data/sdb1)
dis-stripe 分布式条带卷 node1(/data/sdd1)、node2(/data/sdd1)、node3(/data/sdd1)、node4(/data/sdd1)
dis-rep 分布式复制卷 node1(/data/sde1)、node2(/data/sde1)、node3(/data/sde1)、node4(/data/sde1)
1.创建分布式卷
#创建分布式卷,没有指定类型,默认创建的是分布式卷
[root@node1 ~] # gluster volume create dis-volume node1:/data/sdb1 node2:/data/sdb1 force
volume create: dis-volume: success: please start the volume to access data
[root@node1 ~] # gluster volume list
dis-volume
[root@node1 ~] # gluster volume start dis-volume
volume start: dis-volume: success
[root@node1 ~] # gluster volume info dis-volume
Volume Name: dis-volume
Type: Distribute
Volume ID: 8f948537-5ac9-4091-97eb-0bdcf142f4aa
Status: Started
Snapshot Count: 0
Number of Bricks: 2
Transport-type: tcp
Bricks:
Brick1: node1:/data/sdb1
Brick2: node2:/data/sdb1
Options Reconfigured:
transport.address-family: inet
nfs.disable: on
3.创建复制卷
#指定类型为 replica,数值为 2,且后面跟了 2 个 Brick Server,所以创建的是复制卷
[root@node1 ~] # gluster volume create rep-volume replica 2 node3:/data/sdb1 node4:/data/sdb1 force
volume create: rep-volume: success: please start the volume to access data
[root@node1 ~] # gluster volume start rep-volume
volume start: rep-volume: success
[root@node1 ~] # gluster volume info rep-volume
Volume Name: rep-volume
Type: Replicate
Volume ID: 9d39a2a6-b71a-44a5-8ea5-5259d8aef518
Status: Started
Snapshot Count: 0
Number of Bricks: 1 x 2 = 2
Transport-type: tcp
Bricks:
Brick1: node3:/data/sdb1
Brick2: node4:/data/sdb1
Options Reconfigured:
transport.address-family: inet
nfs.disable: on
4.创建分布式条带卷
#指定类型为 stripe,数值为 2,而且后面跟了 4 个 Brick Server,是 2 的两倍,所以创建的是分布式条带卷
[root@node1 ~] # gluster volume create dis-stripe stripe 2 node1:/data/sdd1 node2:/data/sdd1 node3:/data/sdd1 node4:/data/sdd1 force
volume create: dis-stripe: success: please start the volume to access data
[root@node1 ~] # gluster volume start dis-stripe
volume start: dis-stripe: success
[root@node1 ~] # gluster volume info dis-stripe
Volume Name: dis-stripe
Type: Distributed-Stripe
Volume ID: beb7aa78-78d1-435f-8d29-c163878c73f0
Status: Started
Snapshot Count: 0
Number of Bricks: 2 x 2 = 4
Transport-type: tcp
Bricks:
Brick1: node1:/data/sdd1
Brick2: node2:/data/sdd1
Brick3: node3:/data/sdd1
Brick4: node4:/data/sdd1
Options Reconfigured:
transport.address-family: inet
nfs.disable: on
5.创建分布式复制卷
指定类型为 replica,数值为 2,而且后面跟了 4 个 Brick Server,是 2 的两倍,所以创建的是分布式复制卷
[root@node1 ~] # gluster volume create dis-rep replica 2 node1:/data/sde1 node2:/data/sde1 node3:/data/sde1 node4:/data/sde1 force
volume create: dis-rep: success: please start the volume to access data
[root@node1 ~] # gluster volume start dis-rep
volume start: dis-rep: success
[root@node1 ~] # gluster volume info dis-rep
Volume Name: dis-rep
Type: Distributed-Replicate
Volume ID: 734e38e6-154c-4425-acca-2342577b14e7
Status: Started
Snapshot Count: 0
Number of Bricks: 2 x 2 = 4
Transport-type: tcp
Bricks:
Brick1: node1:/data/sde1
Brick2: node2:/data/sde1
Brick3: node3:/data/sde1
Brick4: node4:/data/sde1
Options Reconfigured:
transport.address-family: inet
nfs.disable: on
=======================
[root@node1 ~] # gluster volume list
dis-rep
dis-stripe
dis-volume
rep-volume
stripe-volume
6、部署gluster客户端
部署Gluster客户端(192.168.189.120)
[root@promote ~]#systemctl stop firewalld
[root@promote ~]#setenforce 0
[root@promote ~]#cd /opt
[root@promote opt]#ls
rh
[root@promote opt]#rz -E
rz waiting to receive.
[root@promote opt]#ls
gfsrepo.zip rh
[root@promote opt]#unzip gfsrepo.zip
[root@promote opt]#cd /etc/yum.repos.d/
[root@promote yum.repos.d]#ls
local.repo repos.bak
[root@promote yum.repos.d]#mv * repos.bak/
mv: 无法将目录"repos.bak" 移动至自身的子目录"repos.bak/repos.bak" 下
[root@promote yum.repos.d]#ls
repos.bak
[root@promote yum.repos.d]#vim glfs.repo
[glfs]
name=glfs
baseurl=file:///opt/gfsrepo
gpgcheck=0
enabled=1
========》wq
[root@promote yum.repos.d]#yum clean all && yum makecache
[root@promote yum.repos.d]#yum -y install glusterfs glusterfs-fuse
[root@promote yum.repos.d]#mkdir -p /test/{dis,stripe,rep,dis_stripe,dis_rep}
[root@promote yum.repos.d]#cd /test/
[root@promote test]#ls
dis dis_rep dis_stripe rep stripe
[root@promote test]#
[root@promote test]#echo "192.168.189.101 node1" >> /etc/hosts
[root@promote test]#echo "192.168.189.102 node2" >> /etc/hosts
[root@promote test]#echo "192.168.189.103 node3" >> /etc/hosts
[root@promote test]#echo "192.168.189.104 node4" >> /etc/hosts
[root@promote test]#
[root@promote test]#mount.glusterfs node1:dis-volume /test/dis
[root@promote test]#mount.glusterfs node1:stripe-volume /test/stripe
[root@promote test]#mount.glusterfs node1:rep-volume /test/rep
[root@promote test]#mount.glusterfs node1:dis-stripe /test/dis_stripe
[root@promote test]#mount.glusterfs node1:dis-rep /test/dis_rep
[root@promote test]#
[root@promote test]#df -h
文件系统 容量 已用 可用 已用% 挂载点
/dev/sda2 16G 3.5G 13G 22% /
devtmpfs 898M 0 898M 0% /dev
tmpfs 912M 0 912M 0% /dev/shm
tmpfs 912M 18M 894M 2% /run
tmpfs 912M 0 912M 0% /sys/fs/cgroup
/dev/sda5 10G 37M 10G 1% /home
/dev/sda1 10G 174M 9.9G 2% /boot
tmpfs 183M 4.0K 183M 1% /run/user/42
tmpfs 183M 40K 183M 1% /run/user/0
/dev/sr0 4.3G 4.3G 0 100% /mnt
node1:dis-volume 6.0G 65M 6.0G 2% /test/dis
node1:stripe-volume 8.0G 65M 8.0G 1% /test/stripe
node1:rep-volume 3.0G 33M 3.0G 2% /test/rep
node1:dis-stripe 21G 130M 21G 1% /test/dis_stripe
node1:dis-rep 11G 65M 11G 1% /test/dis_rep
[root@promote test]#cd /opt
[root@promote opt]#dd if=/dev/zero of=/opt/demo1.log bs=1M count=40
记录了40+0 的读入
记录了40+0 的写出
41943040字节(42 MB)已复制,0.0311576 秒,1.3 GB/秒
[root@promote opt]#dd if=/dev/zero of=/opt/demo2.log bs=1M count=40
记录了40+0 的读入
记录了40+0 的写出
41943040字节(42 MB)已复制,0.182058 秒,230 MB/秒
[root@promote opt]#dd if=/dev/zero of=/opt/demo3.log bs=1M count=40
记录了40+0 的读入
记录了40+0 的写出
41943040字节(42 MB)已复制,0.196193 秒,214 MB/秒
[root@promote opt]#dd if=/dev/zero of=/opt/demo4.log bs=1M count=40
记录了40+0 的读入
记录了40+0 的写出
41943040字节(42 MB)已复制,0.169933 秒,247 MB/秒
[root@promote opt]#dd if=/dev/zero of=/opt/demo5.log bs=1M count=40
记录了40+0 的读入
记录了40+0 的写出
41943040字节(42 MB)已复制,0.181712 秒,231 MB/秒
[root@promote opt]#
[root@promote opt]#cp demo* /test/dis
[root@promote opt]#cp demo* /test/stripe/
[root@promote opt]#cp demo* /test/rep/
[root@promote opt]#cp demo* /test/dis_stripe/
[root@promote opt]#cp demo* /test/dis_rep/
[root@promote opt]#cd /test/
[root@promote test]#tree
.
├── dis
│ ├── demo1.log
│ ├── demo2.log
│ ├── demo3.log
│ ├── demo4.log
│ └── demo5.log
├── dis_rep
│ ├── demo1.log
│ ├── demo2.log
│ ├── demo3.log
│ ├── demo4.log
│ └── demo5.log
├── dis_stripe
│ ├── demo1.log
│ ├── demo2.log
│ ├── demo3.log
│ ├── demo4.log
│ └── demo5.log
├── rep
│ ├── demo1.log
│ ├── demo2.log
│ ├── demo3.log
│ ├── demo4.log
│ └── demo5.log
└── stripe
├── demo1.log
├── demo2.log
├── demo3.log
├── demo4.log
└── demo5.log
5 directories, 25 files
[root@promote test]#
7、查看文件分布
1、查看分布式文件分布(node1:/dev/sdb1、node2:/dev/sdb1)
[root@node1 ~] # ls -lh /data/sdb1
2、查看条带卷文件分布(node1:/dev/sdc1、node2:/dev/sdc1)
[root@node1 ~] # ls -lh /data/sdc1
3、查看复制卷文件分布(node3:/dev/sdb1、node4:/dev/sdb1)
[root@node3 ~]#ll -h /data/sdb1
4、查看分布式条带卷分布(node1:/dev/sdd1、node2:/dev/sdd1、node3:/dev/sdd1、node4:/dev/sdd1)
[root@node1 ~] # ll -h /data/sdd1
5、查看分布式复制卷分布(node1:/dev/sde1、node2:/dev/sde1、node3:/dev/sde1、node4:/dev/sde1)
六、冗余测试
在客户端(192.168.189.120)上查看文件是否正常
1、分布式卷数据查看,缺少demo5,这是在node2上的,不具备冗余
挂起 node2 节点或者关闭glusterd服务来模拟故障
[root@node2 ~]# init 0
[root@promote test]#ll /test/dis